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Sl.1 导 谨 


(一 ) 什么 是 数理 统计 学 

关于 数理 统计 学 ， 现 在 已 有 了 用 各 种 文字 出 版 的 大 量 教科 书 
和 专著 .在 这 些 著作 中 , 对 数理 统计 学 的 性 质 、 任 务 、 应 用 等 等 , 作 
了 不 少 的 论述 .应 该 说 ， 这 些 问 题目 前 在 统计 学 界 并 无 原则 性 的 
分 歧 . 但 是 ， 若 试图 用 少量 的 文字 对 “数理 统计 学 ”这 个 学 科 下 一 
个 正式 的 定义 ， 就 会 碰 到 不 少 困难 . 你 很 难 找 到 一 种 说 法 是 完全 
无 懈 可 击 的 . 况且 , 任何 这 样 的 定义 , 车 不 辅 之 以 大 量 的 解释 , 就 
无 法 使 人 理解 . 因此 , 在 以 下 的 叙述 中 , 我 们 将 致力 于 从 一 些 方面 
把 数理 统计 学 的 实质 说 清楚 ,而 不 着 重 于 一 个 形式 的 定义 ， 

当 用 观察 和 实验 的 方法 去 研究 一 个 问题 时 ， 第 一 步 就 是 通过 
观察 或 试验 以 收集 必要 的 数据 ， 这 些 数据 受到 偶然 性 即 随机 性 因 
素 的 影响 。 下 一 步 就 是 对 所 收集 的 数据 进行 分 析 ， 以 对 所 研究 的 
问题 作出 某 种 形式 的 结论 .在 这 两 个 步骤 中 ， 都 会 碰 到 许多 数学 
问题 ， 为 解决 这 些 问题 ， 发 展 了 许多 理论 和 方法 ， 这 些 就 构成 数 
理 统计 学 的 内 容 。 故 一 般 地 可 以 说 ， 数 理 统计 学 是 数学 的 一 个 分 
支 ， 它 的 任务 是 研究 怎样 用 有 效 的 方法 去 妆 集 和 使 用 带 湖 机 性 影 
响 的 数据 ， 下 面 来 作 些 解释 . 

IT. 数据 必须 带 有 湖 机 性 的 影响 ,才能 成 为 数理 统计 学 的 研究 
对 象 ， 例 如， 考虑 一 个 国家 的 全 面 人 口 普 查 ， 假 定 人 力 物 力 时 间 
允许 我 们 对 国内 每 一 个 人 的 状况 进行 调查 ， 而 这 种 调查 又 是 准确 
无 误 的 , 则 我 们 可 利用 普查 所 得 数据 , 通过 既定 的 方法 , 把 所 感 兴 
趣 的 指标 计算 出 来 , 例如 , 男性 人 口 占 全 体 人 口 的 百 分 之 多 少 , 在 
所 作假 定之 下 这 是 准确 无 误 的 . 这 里 不 需要 用 到 什么 数理 统计 方 


s 1 。 


法 . 又 如 要 比较 两 个 小 麦 品 种 甲乙 谁 优 ( 能 有 更 高 的 产量 )， 著 我 
们 作 一 个 不 大 现实 的 假定 , 即 其 他 条 件 可 以 控制 得 如 此 严格 ( 且 这 
种 条 件 也 是 日 后 大 面积 推广 时 所 使 用 的 ), 以 致 产量 完全 取决 于 品 
种 , 则 我 们 只 须 在 两 块 地 上 把 甲乙 各 种 植 一 次 , 就 可 准确 无 误 地 
所 其 优先 在 此 攻 理 统 计 方 法 世 没 有 用 武之 抽 ， 芝 之， 二 要 
定数 据 有 随机 性 ， 是 区 别 数理 统计 方法 和 其 他 数据 处 理 方法 的 权 
本 点 . | 

数据 的 随机 性 的 来 源 有 二 ， 一 是 问题 中 所 涉及 的 研究 对 象 为 
数 很 大 ， 我 们 不 可 能 对 之 全 部 加 以 研究 ， 而 只 能 用 “一 定 的 方式 ” 
(说 详 下 ) 挑选 其 一 部 分 去 考察 ， 例 如 , 一 批 产品 有 10,000 件 , 其 
中 含有 废品 m 件 ,mm 未 知 ， 因 而 废品 率 2 一 ooy10000 也 未 知 .要 
确切 地 知道 p， 必 须 对 这 10000 件 逐 一 加 以 检验 . 这 不 仅 是 不 经 
济 的 ， 且 往往 无 法 做 到 (如 检验 是 破坏 性 的 ) 因此 我 们 只 能 从 其 
中 挑 出 一 部 分 ， 例 如 100 件 ， 根 据 对 这 100 件 的 检验 结果 去 估计 
2p， 在 这 里 , 随机 性 的 影响 就 表现 在 : 那 100 件 被 挑 出 是 偶然 的 . 

一 般 , 在 社会 调查 性 质 的 问题 中 , 问题 的 要 求 规定 了 调查 的 范 
围 。 如 问题 是 研究 某 一 地 区 内 以 农户 为 单位 的 经 济 状 部， 则 该 地 
区 的 全 体 农户 都 是 调查 对 象 ， 若 这 个 数目 太 天 ， 则 我 们 只 能 挑 一 
部 分 作 实地 调查 .这 时 ， 所 得 数据 的 随机 性 就 来 自 被 挑 出 的 农户 
的 随机 性 ， 对 这 种 数据 作 分 析 , 就 必须 使 用 数理 统计 方法 . 

数据 随机 性 的 另 一 种 来 源 是 试验 的 随机 误差 ， 这 是 把 那 种 在 
试验 过 程 中 未 各 控制 、 无 浴 擦 制 ， 甚 至 不 了 解 的 因素 所 引起 的 误 
差 ， 例 如 , 设 反 应 温度 和 压力 是 影响 产品 质量 了 的 重要 因素 ， 我 
们 想 通 过 一 定 的 试验 去 考察 这 影响 的 程度 ， 并 挑选 一 个 适当 的 温 
度 和 压力 值 以 供 在 今后 大 批 生 产 中 使 用 ， 但 是 ,了 除了 与 温度 、 压 
力 有 关外 ,还 受到 大 量 其 他 因素 的 影响 .例如 ,每 次 试验 所 用 原 材 
料 略 有 差异 ， 可 能 使 用 不 同 的 仪器 设备 和 操作 者 等 等 。 这 些 因 素 
无 法 或 不 便 加 以 完全 的 控制 ， 而 对 试验 结果 (数据 ) 产 生 随机 性 的 
影响 。 这 就 带 来 一 种 不 确定 性 ， 例 如 , 从 试验 数据 上 看 ,使 用 温度 
二 比 用 至 好 。 但 这 个 表现 在 数据 上 的 优势 究竟 是 本 质 的 一 一 即 
s 2 » 


有 足够 的 理由 可 解释 为 是 由 于 乌 确 优 王石, 还 是 只 是 随机 误差 的 
偶然 性 表现 ?这 就 需要 用 数理 统计 的 方法 去 分 析 . 

2. 所 谓 “ 用 有 效 的 方式 收集 数据 ”-- 语 中 , 有 效 一 词 该 如 何 解 
释 ， 妇 纳 起 来 有 两 个 方面 ， 一 是 可 以 建立 一 个 在 数学 上 可 以 处 理 
并 尽 可 能 简单 方便 的 模型 来 描述 所 得 数据 ， 一 是 数据 中 要 包含 尽 
可 能 多 的 .与 所 研究 的 问题 有 关 的 信息 ， 

例如 , 在 考察 基地 区 共 10, 000 农户 的 经 济 状况 的 问题 中 , 我 
们 前 面 说 挑 出 100 户 作 实际 调查 . 100 这 个 数字 是 否 恰 当 ? 太 大 
了 则 费用 过 大 , 太 小 了 则 代表 性 不 够 、 要 决定 一 个 较 好 的 数字 , 须 
权衡 这 两 个 方面 , 并 用 得 着 统计 方法 ， 其 次 , 假定 我 们 选择 了 100 
这 个 数字 .这 100 户 如 何 挑 选 ? 假设 你 上 只 在 该 地 区 最 富裕 的 那 部 
分 去 挑 , 这 样 得 到 的 数据 就 没有 代表 性 ， 也 谈 不 上 有 效 了 .反之 ， 
你 如 果 用 一 种 纯 随机 化 的 方法 ， 即 设法 使 这 10000 户 中 的 每 一 户 
有 同等 的 机 会 被 挑 出, 则 所 得 数据 就 有 一 定 的 代表 性 , 我 们 也 不 难 
建立 一 个 简单 的 模型 来 描述 它 ， 在 一 些 情 况 下 ， 我 们 还 可 以 设计 
出 更 有 效 的 方法 . 举 一 个 简单 情况 . 若 该 地 区 分 成 平原 和 山区 两 
部 分 ,前 者 较 富 裕 且 占 全 体 农户 的 70%, 则 我 们 可 规定 , 在 预定 要 
考察 的 100 户 中 ,有 70 户 从 平原 地 区 挑 ，30 户 从 山区 挑 ， 而 在 各 
自 的 范围 内 则 用 纯 随机 化 的 方式 挑 ， 直 观 上 我 们 觉得 ， 这 样 得 到 
的 数据 ， 比 在 全 体 10000 户 中 用 随机 化 方式 挑选 得 到 的 数据 更 有 
代表 性 ,因而 也 更 “有 效 ”.， 数理 统 计 的 理论 证 明确 是 如 此 . 

又 如 ,在 产品 质量 与 反应 温度 和 压力 的 关系 的 例 中 , 怎样 用 有 
效 的 方式 收集 数据 ， 问 题 更 多 ， 若 可 以 考虑 的 温度 在 友和 妇 之 
间 , 压力 在 pi 和 pr 之 间 , 首先 ， 我 们 当然 具 能 取 有 限 个 温度 和 压 
力 值 去 做 试验 ， 了 下 多 少 个 值 好 ?这 里 也 有 与 上 例 中 一 样 的 问题 , 太 
多 了 费用 太 大 , 太 少 了 不 说 明 问 题 . 在 定 下 了 一 个 数目, 例如 四 个 
温度 值 和 四 个 压力 值 去 做 试验 ， 则 这 些 值 是 否 均 匀 地 取 在 相应 的 
区 间 中 好 ? 另外 , 若 把 这 些 值 所 有 可 能 的 搭配 都 做 试验 , 则 至 少 需 
做 16 次 ， 也 许 条 件 不 允许 做 这 么 多 , 而 只 能 做 一 部 分 , 则 这 一 部 
分 如 何 挑选 ?这 些 问题 解决 得 好 ,试验 数据 就 有 一 种 平衡 或 对 称 的 
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结构 ,不 仅 更 富 于 代表 性 , 且 可 建立 一 种 简单 而 便于 分 析 的 模型 

用 有 效 的 方式 收集 数据 的 问题 的 研究 ， 构 成 了 数理 统计 学 中 
的 两 个 分 支 , 其 一 叫 抽样 理论 , 其 二 叫 试验 设计 , 它们 分 别处 理 相 
当 于 上 面 讨论 过 的 两 个 例子 中 的 那 种 类 型 的 数据 收集 问题 . 

3. 兴 在 来 解释 “有 效 地 使 用 数据 ” 一 语 的 意义 。 获取 数据 的 
目的 ， 是 提供 与 所 研究 的 问题 有 关 的 信息 ， 但 这 种 信息 并 非 是 一 
目 了 然 地 表现 出 来 , 而 需要 用 “有 效 ” 的 方式 去 集中 、 提 取 , 进而 利 
用 之 以 对 所 研究 的 问题 作出 一 定 的 结论 ， 这 种 “结论 ”， 在 统计 上 
叫做 “推断 ”. 在 $1.3 中 我 们 将 仔细 解释 统计 推断 的 意义 , 这 里 只 
指出 ; 所 作 的 推断 应 是 对 所 提出 的 问题 的 一 个 回答 ,而 不 只 限于 所 
得 数据 的 范围 内 ， 有 效 地 使 用 数据 , 就 是 要 使 用 有 效 的 方法 , 去 集 
中 和 提取 试验 数据 中 的 有 关 信 息 ， 以 对 所 研究 的 问题 作出 尽 可 能 
精确 和 可 靠 的 推断 ， 其 所 以 只 能 做 到 “ 尽 可 能 ”而 非 绝对 地 精确 和 
可 靠 ， 是 因为 数据 受到 随机 性 因素 的 影响 ， 这 种 影响 可 以 通过 统 
计 方 法 去 估计 或 缩小 其 干扰 作用 ,但 不 可 能 完全 消除 . 

为 有 效 地 使 用 数据 以 进行 统计 推断 , 涉及 很 多 的 数学 问题 , 需 
要 建立 一 定 的 数学 模型 , 并 给 定 某 些 准 则 , 才 有 可 能 去 评价 和 比较 
种 种 统计 推断 方法 的 优 劣 ， 例 如 ,为 估计 一 物体 的 重量 w, 把 它 在 
天 平 上 秤 九 次 , 得 到 数据 z1,…, zs， 它 们 都 受到 随机 性 因素 的 影 
响 (影响 大 小 反映 天 平 的 精密 度 )， 我 们 可 以 用 这 九 个 值 的 算 林 平 
均 元 = 训 (oa 十 … 十 mm) 去 估计 也 可 以 考虑 下 述 方法 ; 把 nu …， 
ws 按 大 小 依次 排列 成 za 和 za < 生 …< 和 oo, 而 取 正中 间 的 一 个 ， 即 
ae, 去 估计 &. 甚至 也 可 以 用 两 个 极端 值 的 平均 ， 即 由 = 去 (za 十 
vo, ) . 你 可 能 在 直观 上 会 认为 ， 作为 42 的 估计 ， 2 优 于 vs), MH wo 
又 优 于 w， 但 是 为 什么 ?这 是 不 是 对 ? 在 什么 意义 下 对 ? 在 什么 条 
件 下 对 ? 这些 问题 就 不 容易 回答 、 事 实 上 , 对 这 些 问题 的 研究 , 正 
是 数理 统计 学 的 中 心 内 容 , 要 使 用 大 量 的 数学 和 概率 论 的 工具 .以 
后 我 们 将 看 到 , 在 一 定 的 情况 (取决 于 随机 性 影响 的 概率 结构 ， 即 
统计 模型 ) 和 一 定 的 意义 ( 即 衡量 优越 性 的 指标 ) 之 下 , 上述 三 个 信 
» 生 ， 


计 方 法 中 的 任 一 个 都 可 能 成 为 最 优 的 . 

4. 最 后 一 点 , 就 是 数理 统计 学 只 处 理 在 收集 和 使 用 带 随机 性 
影响 的 数据 中 的 数学 问题 , 因而 是 一 个 数学 分 支 

一 个 问题 的 研究 ， 水 及 到 问题 所 在 领域 的 专门 知识 ， 数 理 统 
计 学 不 以 任何 一 种 专门 领域 为 研究 对 象 ， 不 论 你 的 问题 是 物理 学 
的 、 化 学 的 、 生物 学 的 或 工程 技术 方面 的 , 只 要 在 安排 试验 和 处 理 
试验 数据 中 涉及 到 一 些 一 般 性 的 .共同 的 数学 问题 , 就 可 以 用 统计 
方法 ， 例 如 ,不论 作 那 种 试验 ,都 有 一 个 试验 规模 的 问题 ， 即 试验 
须 重复 多 少 次 ， 才 能 把 随机 误差 的 影响 控制 在 必要 的 限度 内 ， 这 
是 一 个 与 专业 知识 无 关 的 带 共性 的 问题 , 一 组 试验 数据 , 只 要 对 其 
所 受 的 随机 性 影响 作 了 明确 的 规定 (如 服从 正 态 分 布 )， 则 可 以 用 
相应 的 统计 方法 去 分 析 之 ， 而 不 管 这 些 数据 的 实际 含义 如 何 ， 这 
种 带 共 性 的 问题 既然 从 专门 的 知识 领域 中 超脱 出 来 ， 就 可 以 用 纯 
数学 的 方法 去 研究 , 这 就 是 数理 统计 学 的 对 象 ， 我 们 这 样 说 , 并 不 
意味 着 一 个 数理 统计 学 者 可 以 不 过 问 其 他 专门 领域 的 知识 . 相反， 
如 果 他 要 将 统计 方法 用 于 实际 问题 ， 他 必须 对 所 论 问题 的 专门 知 
识 有 一 定 的 了 解 ， 这 不仅 可 以 帮助 他 也 证 恰当 的 统计 模型 和 统计 
方法 ， 而 且 ， 用 数理 统计 方法 分 析 随 机 性 数据 所 得 结论 的 恰当 解 
释 , 离 不 开 所 论 问题 的 专门 知识 ， 便 如 , 数理 统计 方法 对 数量 遗传 
学 很 有 用 , 但 一 个 对 遗传 学 一 无 所 知 的 统计 学 家 , 就 难于 在 这 个 领 
域 中 有 所 作为 . 

统计 方法 的 应 用 很 广泛 , 所 以 许多 学 习 其 他 专业 的 人 ,都 需要 
一 些 这 方面 的 知识 。 幸 好 ， 统 计 方法 的 具体 使 用 并 不 需要 很 高 深 
的 数学 知识 ， 相 反 , 这 些 方法 的 理论 根据 ,不 具备 较 多 较 深 的 数学 
知识 就 说 不 清楚 因此 , 在 一 些 统计 方法 得 到 广泛 应 用 的 国家 , 例 
如 在 美国 ， 出 版 了 大 量 专 供 各 领域 的 应 用 者 使 用 的 著作 ， 这 种 车 
作 介绍 统计 方法 及 其 应 用 ， 但 不 涉及 或 很 少 涉及 这 些 方法 的 理论 
根据 ， 这 种 著作 被 列 入 “统计 方法 ”或 “应 用 统计 ”的 范畴 内 , 而 只 
有 那 种 用 严格 的 数学 去 论证 统计 方法 的 理论 根据 的 书 ， 才 称 为 数 
理 统计 著作 。 这 显示 在 这 些 国家 生 , “数理 统计 学 ”一 词 是 给 以 一 
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种 狭义 的 解释 , 即 只 包括 统计 学 中 的 数学 基础 部 分 ， 在 我 国 , 数理 
统计 学 一 词 则 是 与 作为 一 门 社会 科学 的 统计 学 相对 而 言 的 ， 粕 略 
地 说 , 在 我 国 , 数理 统计 学 与 西方 的 统计 学 相当 , 而 具有 较 广泛 的 
含义 。 明白 这 个 差别 就 可 以 避免 一 些 误解 . 


(二 ) 数理 统计 学 的 应 用 

数理 统计 方法 的 应 用 很 广泛 ， 几 乎 在 人 类 活动 前 一 切 领域 中 
都 能 程度 不 同 地 找到 它 的 应 用 。 这 是 因为 , 实验 是 科学 研究 的 根 
本 方法 ,而 随机 性 因素 对 试验 结果 的 影响 是 无 所 不 在 的 ， 反 过 来 ， 
应 用 上 的 需要 又 是 统计 方法 发 展 的 动力 、 例 如 , 现代 数理 统计 的 
葛 基 和、 英国 著名 学 者 R. A. Fisher 入. Pearson 在 本 世纪 初期 
大 力 从 事 这 方面 的 研究 , 就 是 出 于 存 生物 学 、 数量 遗传 学 . 优生 学 
和 农业 科学 方面 的 需要 . 

在 工农 业 生 产 中 ,一 个 常见 的 问题 是 . 有 一 个 (或 多 个 ) 我 们 感 
兴趣 的 指标 , 如 工业 产品 的 基 项 质量 指标 , 农业 中 的 单位 面积 产量 
等 .有 一 些 因素 对 这 个 指标 可 能 有 影响 , 例如 , 工业 生产 中 所 用 设 
备 、 原 材料、 配方 和 温度 、 压 力 及 反应 时 间 等 工艺 因素 ， 农 业 生产 
中 所 用 种 子 品 种 , 肥料 类 型 和 施放 数量 , 以 及 耕作 方法 等 方面 的 抠 ) 
素 . 为 了 得 到 最 大 的 经 济 效益 , 需要 了 解 这 些 因素 对 所 感 兴趣 的 
指标 起 影响 的 具体 情况 , 那些 因素 是 主要 的 , 其 影响 有 多 大 , 因素 
.了 指标 之 间 是 否 可 建立 某 种 数量 上 的 联系 等 等 ， 弄 清楚 了 这 些 问 
题 , 就 可 确定 一 组 较 好 的 生产 条 件 ， 这 些 都 要 通过 做 试验 ,就 是 把 
有 关 因素 固定 在 某 些 水 平 上 做 试验 ,去 观察 感 兴趣 的 指标 值 .《 诸 
验 要 经 过 精心 的 设计 ， 所 得 试验 结果 必然 受到 大 量 随 机 因素 的 影 
响 , 而 必须 用 统计 方法 分 析 ， 因 此 , 随 着 近 儿 十 年 来 工农 业 生 产 的 
规模 愈 来 愈 大 , 数理 统计 学 在 这 方面 的 应 用 也 与 日 俱 增 。 在 历史 
上 说 , 试验 设计 的 基本 思想 , 以 及 分 析 试 验 数 据 的 一 种 极 重要 的 方 
法 -一 一 方差 分 析 方 法 ， 就 是 RR. A. Fisher 等 在 1923~1926 年 期 
间 , 在 进行 田间 试验 中 开始 发 展 起 来 的 ，Fisher 提出 的 思想 和 方 
法 ,在 四 十 年 代 以 来 经 过 发 展 , 日益 广 泛 地 用 于 工业 生产 中 ， 目 前 
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最 常用 的 正 交 设计 ,就 是 一 个 有 代表 性 的 例子 . 

数理 统计 方法 应 用 于 工业 的 另 一 个 重要 方面 是 ， 现 代 工业 生 
产 多 有 大 批量 及 要 求 很 高 的 可 车 度 的 特点 。 需 要 在 连续 生产 的 过 
程 中 进行 工序 控制 , 成 批 的 产品 在 交付 使 用 前 要 进行 验收 , 这 种 验 
收 一 般 不 能 是 多面 检验 , 而 只 能 是 抽样 验收 ， 需要 根据 数理 统计 
学 的 原理 , 去 制定 适合 种 种 要 求 的 抽样 验收 方案 ， 还 有 , 一 个 大 型 
设备 往往 包含 成 千 上 万 个 元 件 ， 由 于 元 件数 目 很 大 , 它们 的 寿命 
可 视 为 随机 的 而 服从 一 定 的 概率 分 布 规 律 。， 整 个 设备 的 可 靠 性 ， 
与 设备 的 结构 及 这 种 分 布 规律 有 关 ， 因 而 可 以 用 统计 方法 去 估计 
之 、 为 解决 上 面 这 些 问题 , 发 展 了 一 系列 的 统计 方法 , 目前 常 提 到 
的 “统计 质量 管理 ”, 就 是 由 这 些 方法 构成 的 . 

统计 方法 在 做 药 卫 件 中 有 广泛 的 应 用 。 例如 , 治疗 一 种 疾病 
的 种 种 药物 和 治疗 琅 活 的 效果 , 常 引用 统计 资料 来 说 明 .。 这 种 材 
料 的 可 信 性 ,依赖 于 其 数据 的 取得 方法 与 使 用 的 统计 方法 ， 其 他 ， 
如 分 析 某 种 疾病 的 发 生 是 否 与 特定 因素 有 关 ( 一 个 著名 的 例子 是 
吸烟 与 患 癌症 的 关系 ), 关系 大 小 , 在 污染 大 气 的 许多 有 害 成 分 中 ， 
那些 成 分 对 人 体 有 何 种 程度 的 影响 ， 这 类 问题 常用 数理 统计 方法 
去 研究 , 取得 了 不 少 有 用 的 成 果 ， 

数理 统计 方法 在 气象 预报 、 地 震 和 地 质 探矿 等 方面 有 一 些 应 
用 .在 这 类 领域 中 ,人 们 对 事物 的 规律 性 认识 尚 不 充分 ,使 用 统计 
分 析 方法 可 能 有 助 于 获得 一 些 对 潜在 的 规律 性 的 认识 ， 而 用 以 指 
导 人 们 的 行动 。 不 过 , 在 人 们 对 事物 的 规律 性 认识 很 不 充分 的 情 
况 下 ,一 些 起 比较 大 的 作用 的 系统 性 因素 ,只 好 当 作 随机 性 因素 来 
处 理 , 这样, 统计 分 析 的 精度 或 可 靠 性 就 较 差 

自然 科学 的 任务 是 揭示 自然 界 的 规律 性 一般 是 先 根据 若干 
观察 或 试验 资料 提出 某 种 初步 理论 或 假说 ， 然 后 再 从 种 种 途径 通 
过 实验 去 验证 之 、 在 这 里 统计 方法 起 相当 的 作用 ， 一 个 好 的 统计 
方法 有 其 于 提取 观察 和 试验 数据 中 带 根 本 性 的 东西 ， 因 而 有 助 于 
提出 较 正 确 的 理论 或 假说 ， 在 有 了 一 定 的 理论 或 假说 后 , 统计 方 
法 可 以 指导 学 者 如 何 去 安 排 进 一 步 的 观察 或 试验 ， 以 使 所 得 数据 
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更 有 助 于 判定 理论 或 假说 是 否 正确 、 数 理 统计 学 也 提供 了 一 些 理 
论 上 健全 的 方法 , 以 估量 观察 或 试验 数据 与 理论 的 符合 程度 如 何 。 
一 个 著名 的 例子 是 遗传 学 中 的 Mendal 定律 、 这 个 根据 观察 资料 
提出 的 定律 ， 经 历 了 严格 的 统计 检验 .数量 遗传 学 的 基本 定律 
Hardy-Weinberg 平衡 定律 , 也 是 属于 这 种 性 质 . 
数理 统计 方法 在 社会 、 经 济 领域 中 也 有 很 多 应 用 。 在 某 些 国 
家 中 ,统计 方法 在 这 些 方面 的 应 用 , 比 其 在 自然 科学 和 技术 领域 中 
的 应 用 更 为 显著 ， 统 计 方 法 在 社会 领域 中 的 一 项 重要 应 用 是 抽样 

查 . 经 验证 明 , 经 过 精心 设计 和 组 织 的 抽样 调查 , 其 效果 可 以 达 
到 以 至 超过 全 面 调查 的 水 平 。 另外 , 对 社会 现象 的 研究 有 向 定 景 
化 发 展 的 趋势 , 例如 人口 学 , 确定 一 个 合适 的 人 口 发 展 动态 模型 ， 
需要 掌握 大 量 的 观察 资料 ， 并 使 用 包括 统计 方法 在 内 的 一 些 科 学 
分 析 方法 . 在 经 济 科学 中 , 定量 化 的 趋势 比 其 他 社会 科学 部 门 更 
早 更 深 . 章 在 本 世纪 二 、 三 十 年 代 , 时 间 序 列 的 统计 分 析 方 法 就 用 
竹 市 场 预测 、 现 车 ;一 系列 的 统计 方法 , 从 简单 的 到 很 艰深 的 , 都 
(在 数 量 经 济 学 和 数理 经 济 学 中 找到 了 应 用 . 


(三 ) 简单 历史 

下 面 我 们 简单 地 介绍 一 下 数理 统计 学 这 站 学 科 的 简单 历史 . 
这 必然 是 极为 “ 粗 线条 ”的 , 因为 叙述 一 门 学 科 的 历史 ; 离 不 开 这 门 
学 科 的 具体 内 容 ， 另 外 , 关于 数理 统计 学 的 早期 发 展 情况 , 学 者 们 
很 少 论述 ,可 资 征 引 的 文献 很 少 . 

数理 统计 学 是 一 门 较 年 青 的 学 科 ， 它 主要 的 发 展 是 从 本 世纪 
初 开始 。 在 早期 发 展 中 ， 起 领导 作用 的 是 以 也. A. Fisher 和 区. 
PSarsoa 为 首 的 英国 学 派 ， 特 别 是 fisher， 在 本 享 笠 酌 发 展 中 起 
了 独特 的 作用 .目前 许多 常用 的 统计 方法 以 及 教科 书 中 的 内 容 ， 
都 与 他 的 名 字 有 关 . 其 他 一 些 著名 的 学 者 ， 如 开 . S., Gosset 
(Student). J, Neyman. BE. 8. Pearson (有 KK. Pearson 的 儿子 )、 
A. Wald 以 及 我 画 现 这 宝 又 涩 授 等 ， 都 作出 了 根本 性 的 贡献 。 他 
们 的 工作 莫 定 了 许多 统计 分 支 的 基础 ， 提 出 了 一 系列 有 重要 应 用 
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价值 的 统计 方法 ， 和 一 系列 的 基本 概念 和 重要 理论 问题 .有 一 
种 意见 认为 ， 瑞 典 统 计 学 家 五 . Oramer 在 1946 年 发 表 的 著作 
«Mathematical Methods of Statisties» 标志 了 这 门 学 科 达 到 成 熟 
的 地 步 ， 这 样 说 也 许 并 不 过 分 ， 因 为 虽 则 在 此 以 前 已 出 现 了 一 些 
重要 的 统计 著作 , 特别 是 R.A. Fisher 的 <Experimenta]l Design» 
和 和 《Statistical Methods for Research Workers»、 但 第 一 次 用 严 
整 的 数学 方法 总 结 到 那 时 为 止 数理 统计 学 的 主要 成 就 的 ， 还 是 要 
推 Oramer 的 上 述 著 作 ， 

集 和 记录 种 种 数据 的 活动 , 在 人 类 历史 上 很 久远 翻 开 我 
国 的 二 十 四 史 ， 可 以 着 到 上 面 有 很 多 关于 钱粮 人 口 及 地 震 洪水 等 
自然 灾害 的 记录 。 在 西方 , Statistios( 统 计 学 ) 一 词 源 出 于 State( 国 
家 ), 意 指 国家 收集 的 国情 资料 。 也 有 不 少 人 为 研究 特定 问题 而 进 
行 观察 试验 , 收集 资料 。 但 这 些 情况 ,终究 还 不 能 认为 是 数理 统计 
这 门 学 科 已 经 成 立 的 标志 .。 因为 有 许多 工作 , 只 停留 在 收集 数据 
或 对 之 进行 一 些 简 单 的 加 工整 理 . 即使 有 时 也 作出 了 某 种 越 出 已 
有 数据 范围 之 外 的 推断 , 也 只 是 基于 一 种 朴素 的 直观 想法 , 而 未 能 
把 可 题 模型 化 使 之 带 有 普遍 意义 ， 更 谈 不 上 建立 必要 的 基本 概念 
和 理论 了 . 这 种 情况 延续 了 许多 年 , 这 是 因为 , 没有 一 定 的 数学 工 
具 特 别 是 概率 论 的 发 展 , 无 法 建立 现代 意义 下 的 数理 统计 学 。 也 
因为 应 用 方面 的 要 求 还 没有 达到 那么 迫切 ， 足 以 构成 一 股 强大 的 
推动 力 ， 到 上 世纪 后 半期 直至 本 世纪 初 , 情况 才 起 了 较 大 的 变化 . 
是 否 可 以 举 出 某 一 个 时 间或 某 一 部 著作 ， 足 以 作为 数理 统计 学 正 
式 诞生 的 标志 ?学 者 们 提出 过 一 些 意 见 , 但 尚 无 定论 ， 有 的 认为 这 
个 时 间 “ 不 早 于 1850 年 ， 有 的 将 它 定 在 Fisher 诞生 的 那 一 年 
一 一 14890 年 。 有 的 认为 本 世纪 初 其 . Pearson 关于 x 统计 景 的 极 
眼 分 布 的 论文 可 以 作为 一 个 标志 ,也 有 人 认为 直到 1922 年 
Fisher 关于 统计 学 的 数学 基础 的 那 篇 著名 的 论文 发 表 , 数理 统计 
学 才 正 式 诞 生 ， 这 个 时 间 可 能 失 之 过 了 晚 ， 不 过 ，Fisher 的 这 篇 论 
文 首次 概括 了 统计 理论 的 现状 和 存在 的 问题 ， 并 提出 了 数理 统计 
学 的 三 个 任务 ， 文 中 的 观点 的 主要 部 分 到 现在 仍 基 本 有 效 , 因 之 ， 
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Fisher 这 项 工作 无 疑 是 数理 统计 学 建立 过 程 中 的 一 个 里 程 碑 ， 

综合 以 上 所 述 ,我们 可 否 试 探 性 地 下 这 样 一 个 粗 线 条 的 结论 ， 
收集 和 整理 乃至 使 用 观测 和 试验 数据 的 工作 由 来 已 入， 这 类 活动 
对 于 数理 统计 这 门 学 科 的 产生 ， 可 算是 一 个 源头 ， 上 世纪 特别 是 
上 世纪 后 半期 以 来 发 展 速度 加 快 ， 且 有 了 质 的 变化 .在 上 世纪 未 
期 到 本 世纪 初期 这 一 段 ,出 现 了 一 系列 的 重要 工作 。 无论 如 何 , 至 
迟到 本 世纪 二 十 年 代 , 这 门 学 科 已 稳 稳 地 站 位 了 眼 脚 . 本 世纪 前 
四 十 多 年 有 了 迅速 而 全 面 的 发 展 , 到 四 十 年 代 时 , 已 形成 为 一 个 成 
熟 的 数学 分 支 . 

本 进 纪 前 四 十 多 年 是 数理 统计 学 辉煌 发 展 的 时 期 ， 但 战 后 以 
来 这 几 十 年 , 数理 统计 学 的 发 展 也 很 显著 . 许多 在 战 前 开始 成 形 
的 统计 分 支 , 在 战 后 得 到 纵深 的 发 展 、 数学 上 的 深度 比 以 前 大 大 
加 强 了 .也 出 现 了 车 于 带 根本 性 的 新 发 展 ， 如 Wald 的 统计 判决 
理论 与 Bayes 学 派 的 兴起 ( 均 见 第 五 章 ) ,在 数理 统计 的 应 用 方面 ， 
也 给 人 深刻 的 印象 ， 这 不 仅 是 由 于 战 后 工农 业 和 科技 等 方面 迅速 
发 展 所 提出 的 要 求 , 也 由 于 电子 计算 机 这 一 有 力 工具 的 出 现 ， 许 
多 统计 方法 的 实施 都 涉及 很 大 量 的 计算 .在 电子 计算 机 得 到 广泛 
应 用 以 前 , 这 些 方法 的 威力 就 难于 发 挥 ， 例 如 在 五 十 年 代 , 当 电 子 
计算 机 还 很 稀少 时 ， 用 电动 计算 机 计算 一 个 包含 十 余 个 自 变 景 的 
线性 回归 , 得 用 几 十 个 人 花 成 月 的 时 间 , 现在 在 大 型 计算 机 上 , 所 
花 时 间 则 只 以 秒 为 单位 计 . 以 此 之 故 , 有 些 在 战 前 就 双 得 到 充分 
发 展 的 统计 方法 , 真正 在 应 用 上 发 挥 作用 还 是 在 战 司 ， 


$1.2 样本 和 样本 分 布 


在 上 节 中 ,我 们 对 “什么 是 数理 统计 学 ”这 个 问题 , 作 了 一 番 定 
性 式 的 描述 ， 其 所 以 是 定性 的 ， 因 为 我 们 没有 引进 必要 的 数学 概 
念 及 使 用 严密 的 数学 语言 ， 在 一 个 意义 上 说 , 本 章 其 余 这 几 节 是 
继续 上 节 的 工作 ， 对 “什么 是 数理 统计 学 ”这 个 问题 给 以 更 细致 而 
严密 的 回答 。 在 这 个 过 程 中 , 也 就 自然 地 引进 了 一 些 重要 的 基本 
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(一 ) 样本 

通过 观察 或 试验 而 得 到 的 数据 , 称 为 料 本 ,又 称 料 品 , 子 样 ,如 
在 间 一 架 天 平 上 将 一 个 物件 释 m 次 , 得 到 数据 于!, …， 字 。， 则 它 
们 的 全 体 , 即 素 = (和 :，…， 开 。)， 就 称 为 样本 ，m 称 为 样本 大 小 ， 
也 有 称 为 样本 容量 或 样本 含量 的 . 数据 系 ;，…， 碟 。 中 的 每 一 个 ， 
例如 下;, 也 称 作 样本 ， 这 不 致 引起 混淆 . 

在 很 多 情况 下 ， 样 本 环 , 是 数量 性 的 ， 即 取 实 数 为 值 ， 当 然 ， 
也 可 能 只 取 某 些 特 殊 的 实数 值 ,例如 非 负 整数 ， 在 另 一 些 情况 下 ， 
样本 且 ; 是 “属性 ”数据 ， 例 如 ,产品 可 分 为 甲 . 乙 , 丙 三 级 , 一 个 人 
可 以 是 有 病 或 无 病 ， 这 种 局 性 数据 可 以 数量 化 ， 例 如 , 甲 、 乙 、 丙 
三 个 等 级 可 以 分 别 用 1、2、 3 这 三 个 数字 代替 .这 种 数量 化 并 非 
总 是 必要 . 

经 常 ,每 次 观察 或 试验 所 记录 的 , 不 止 一 个 实数 .例如 , 在 一 
大 群 人 中 抽取 % 个 ,每 个 测 得 其 身高 体重 , 为 (及 1, 1),…,( 芳 ，， 
了 ,)、 则 我 们 有 一 组 大 小 为 n 的 二 维 样本 ， 类似 地 有 多 维 样本 . 多 
维 样本 中 的 任 一 个 成 分 称 为 样本 的 分 量 . 如 在 本 例 中， 身高 孚 1 
是 祥 本 ( 肝 ;, 了 ,) 的 一 个 分 量 . 

从 实用 者 的 眼光 看 , 样本 就 是 一 批 已 知 的 数字 ， 但 我 们 不 能 
忘记 : 数理 终 计 学 的 对 象 是 受到 随机 人 性 影响 的 数据 ， 用 概率 论 的 
语言 说 , 样本 是 随机 变量 ， 玫 现 为 已 知 数字 的 具体 样本 , 则 是 这 随 
机 变量 的 观测 值 。 样本 的 这 种 二 重 性 虽然 是 一 件 平凡 的 事情 , 但 
有 很 大 的 重要 性 。 对 理论 工作 者 而 言 ， 他 更 多 注意 到 样本 是 随机 
变量 这 一 点 。 因为 他 所 发 展 的 统计 方 演 应 有 一 定 的 普遍 性 , 不 目 
是 河 用 于 某 些 具体 样本 值 ， 反 之 ,对 应 用 工作 者 而 言 ,他们 昌 则 习 
惯 了 把 样本 看 成 具体 数字 ， 但 仍然 不 能 忽视 :入 本 是 随机 变量 2 这 
个 背景 ， 不然 的 话 , 样本 就 不 过 是 一 堆 杂 乱 无 章 的 、 毫 无 规律 性 可 
言 的 数字 , 没 法 进行 任何 统计 处 理 . 

样本 及 一 ( 卫 1, …，, 于 ,) 可 能 取 的 值 的 全 体 的 集 , 称 为 样本 空 
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间 ， 拿 上面 释 东西 的 例子 说 ， 如 果 我 们 能 定 出 岗 个 实数 4 二 5, 使 
1°， 此 物件 在 天 平 上 秤 量 的 结果 , 不 会 小 于 c 也 不 会 大 于 5. 2°. 
区 闻 [gc, 3] 内 的 每 个 值 都 可 能 取 .， 则 样本 空间 当 为 m 维 欧 氏 空间 
Rr" 中 的 子 集 
4 一 TD， 和) GEVEL, CE 一直 

但 这 一 来 问题 就 很 麻烦 : 因为 即使 在 本 例 这 祥 简单 的 场合 下 , 6、5 
的 确切 值 也 不 易 定 出 ， 因 此 ,我 们 把 样本 空间 的 定义 修改 为 若 某 
个 集合 儿 包含 了 一 切 可 能 的 样本 值 ; 则 儿 称 为 样本 空间 ， 如 在 
上 例 中 ， 我 们 可 以 万 无 一 失地 把 样本 空间 取 为 {wow); 0 所 
<co, 5 一 1，…, mn}， 其 至 取 为 整个 BR*"， 这 样 一 来 , 样本 空间 中 
难免 会 包含 一 些 多 余 点 .这 没有 什么 关系 , 因 下 面 我 们 将 看 到 ; 重 
要 的 是 样本 的 分 布 。 如 果 样 本 空间 中 , 实际 上 不 可 能 出 现 的 点 所 
占 概率 为 0 或 很 小 , 则 对 问题 的 实质 毫 无 影响 或 影响 很 小 . 


(二 ) 样本 分 布 

样本 既然 是 随机 变量 , 就 有 一 定 的 概率 分 布 , 这 个 概率 分 布 就 
串 做 样本 分 布 . 

我 们 曾 多 次 指出 , 样本 , 也 就 是 观察 或 试验 数据 , 是 受到 随机 
性 的 影响 的 .但 是 这 种 影响 的 具体 方式 如 何 , 则 取决 于 所 观察 的 指 
标的 性 质 , 观 察 手段 和 方法 等 .所 有 这 些 , 都 总 结 到 一 个 东西 
样本 分 布 中 去 。 就 是 说 ,样本 分 布 是 祥 本 所 受 随机 性 影响 的 最 完 
整 的 描述 . . 

因此 , 要 决定 样本 的 分 布 ,就 需要 根据 所 观察 的 指标 的 具体 性 
质 ( 这 往往 涉及 有 关 的 专业 知识 )， 以 及 对 抽样 的 方式 或 试验 进行 
的 方式 的 了 解 。 即使 这 样 ,一般 所 了 解 的 情况 仍 不 足以 完全 决定 
样本 的 分 布 , 而 必须 加 进 一 定 程度 的 假设 成 分 ， 我 们 来 看 一 些 例 
子 . 


例 1.1 一 大 批 产品 共有 太 个 ， 其 中 有 废品 Jr 个 ， 六 已 知 
而 未 知 。 现在 要 从 中 抽出 ”个 加 以 检验 , 用 以 估计 ML 或 废品 
率 p 一 Mr/N。 抽 样 的 方式 是 这 样 的 : 第 一 次 抽 一 个 时 ， 个 产品 
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中 的 每 一 个 有 同等 机 会 ( 即 去 ) 被 抽出 . 抽出 后 , 还 剩 下 六 一 工 个 ， 
第 二 次 抽 一 个 时 , 剩 下 这 六 一 工 个 的 每 一 个 有 同等 机 会 被 抽出 ,以 
此 类 推 , 直到 轴 完 个 为 止 . z 

在 本 例 中 我 们 有 一 个 属性 指标 。 先 将 其 数量 化 ， 让 废品 对 应 
1， 合 格 品 对 应 0， 这 样 ， 样 本 了 1，…， 也 ,中 的 每 一 个 都 只 能 取 
0, 1 为 值 ， 给 定 一 组 zz, …, ww, 每 个 mw 为 0 或 1 我们 来 计算 要 
率 了 (了 :~ma …， 大, 一 0%)， 为 便于 讨论 , 设 2 一 1, 四 一 0, mm 一 
1， 为 要 及 1~1, 第 一 个 必须 抽 得 废品 ， 按 “每 一 个 有 同等 机 会 被 
抽出 ”的 规定 , 这 个 事件 的 概率 为 入 ， 到 第 二 次 播 时 ,还 有 太一 1 
个 产品 ,其 中 合格 品 有 加 一 M 个 故 了 ,~0， 即 第 二 次 抽 得 合格 
品 , 概率 为 - 竺 子 ”.。 同 理 推 得 全。 一 1 的 概率 为 -长 二 二 .这样 
下 去 就 不 难 算出 所 要 的 结果 ， 易 验证 

P(R1=%1, **, 

(M—ati) (N—-M)  (N—-M—nt+at1) 
(Naot1) (N-o) {(N—n-t1) ? 
当 zo …, 都 为 0 或 1， 避 m6 (其 他 情况 为 0)，(1.1) 

这 就 是 本 例 的 样本 分 布 

在 有 限 总 体 , 即 总 体 中 只 包含 有 限 个 个 体 的 情况 下 , 这 种 随机 
抽样 一 一 即使 得 总 体 中 每 一 个 体 有 同等 机 会 被 搬出 的 扯 样 方式 ， 
是 一 种 最 基本 的 抽样 方 式 。 更 确切 地 说 , 设 总 体 中 有 个 个 体 而 
预定 抽出 % 个 , 则 随机 搞 样 的 意义 是 ,使 总 体 中 任何 特定 的 % 个 有 


NY\-i 
(0 的 机会 被 抽出 在 具体 工作 中 这 一 点 不 总 是 容易 实现 的 . 


例如 要 在 一 县 的 农户 中 随机 抽 ” 个 ， 则 可 能 需要 制作 交 张 卡片 ， 
把 全 部 农户 编号 填 在 各 卡片 上 , 再 将 卡片 彻底 混乱 后 抽出 ” 张 . 这 


1) 这 个 概率 严格 地 应 理解 为 条 件 硫 率 卫 ( 了 X32 一 01 了 i=1)， 因 为 它 是 在 及 1==1 的 
条 件 下 算出 的 。 以 下 类 似 。 
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还 只 涉及 工作 上 的 繁琐 问题 , 有 时 更 存在 实质 性 的 困难 ， 比 方 说 ， 
要 研究 经 常 打扰 其 睡眠 对 一 个 人 (在 一 定 范 围 内 ) 在 情绪 上 的 影 
响 ， 这 种 试验 必须 志愿 参加 , 这 就 带 来 一 种 非 随机 性 .或 者 , 试验 
者 可 以 从 他 认识 的 人 里 面 去 征求 试验 对 象 ， 这 对 他 研究 的 总 体 而 
言 也 是 非 随 机 的 、 何况, 受 试验 者 对 试验 是 的 的 了 解 ,可 能 会 使 得 
试验 结果 受到 影响 ， 在 这 种 及 类 似 情况 下 , 真正 的 随机 抽样 很 难 
实现 ， 而 研究 者 必须 正确 估量 ,他 抽样 的 那个 实际 (而 非 名 义 ) 总 
体 究竟 是 什么 . | 

例 1.3 仍 考虑 上 例 ， 但 修改 抽样 方式 如 下 , 每 次 抽 一 个 , 记 
录 结 果 后 , 将 其 放 回 去 , 再 抽 第 二 个 ………，, 直到 抽出 ”个 为 止 . 且 
在 每 次 抽取 时 ,六 个 产品 中 每 一 个 有 同等 机 会 被 抽出 . z 

仍 以 及!,…，, 卫 , 记 样 本 ， 在 此 ， 不 论 前 ;一 1 次 抽取 的 结果 
如 何 ， 到 第 次 抽取 时 ， 总 是 及 个 产品 ， 其 中 废品 性 个 ， 攻 


{X420), 5 一 1 …， nn 这 个 事件 独立 , 且 了 P(X 一) 一 千 或 
元 志 , 视 四 一 工 或 0 而 定 。 于 是 得 到 


P(X oe, Keo) = MY -AY 


N N/ ， 
当 ou …, wm 都 为 0 或 1 a (1.2) 
其 他 情况 ,总 


例 1.1 和 例 工 .2 中 的 抽样 方式 分 别称 为 “无 放 回 的 "和 “有 放 
回 的 >?、， 这 个 差别 对 样本 分 布 有 影响 ， 也 可 以 说 成 . 在 这 两 种 不 同 
的 抽样 方式 之 下 , 随机 性 的 影响 也 有 所 不 同 。 红 .2) 比 (1.1) 简 单 
得 多 ， 这 是 由 于 , 在 例 1.2 中 样本 卫 1, …,， 天, 是 独立 同 分 布 的 ， 
而 在 例 工 .1 中 样本 也 1, …， 子 , 不 独立 ， 当 六 /ww 很 大 时 , (1.1) 与 
(1.2) 相 差 很 小 , 因而 在 这 种 情况 王 , 可 以 近似 地 把 不 放 同 的 抽样 
当 作 有 放 回 的 抽样 来 处 理 ， 

例 1.3 某 地 区 一 共有 六 个 农户 ，W 已 知 ， 从 这 丈 个 农户 
中 抽取 %w 户 去 考察 其 经 济 情况 ， 这 里 抽样 也 有 不 放 回 和 放 回 两 
» 1 。 


种 , 从 实际 工作 的 角度 看 抽样 必然 是 不 放 回 的 ,但 如 克 / 很 大 ,可 
近似 地 看 成 是 有 放 回 的 . 

确定 一 个 指标 , 例如 年 纯 收 入 .把 久 户 按 任何 指定 的 方式 纺 
号 ,从 1 开始 至 访 ， 以 mi 记 第 $ 户 的 年 纯 收 入 .， 抽 出 的 %w 户 的 年 
纯 收 入 , 即 样本 , 记 为 了 X1,，…， 了 及 。 假定 抽取 是 随机 的 , 即 在 有 放 


加 时 ,每 次 抽取 抽 得 任 一 户 的 概率 为 各, 而 在 无 放 回 时 , 则 抽 得 还 


鳃 下 的 户 中 任 一 户 的 概率 , 等 于 剩余 下 的 户 数 的 倒数 . 这 样 就 不 
难 求 得 卫 1，…， 访 ,的 分 布 、 暂 设 my,，…, &w 彼此 不 同 ， 则 结 采 
为 : 

1. 无 放 回 时 


P(X 6,, *, Xm) — NT (1.8) 
此 处 人 …， 因 为 彼此 不 相等 的 ,不 超过 福 的 目 然 数 . 
2， 有 放 回 时 i 


P(¥1~00, ,Ta ) -( 寺 ). (1.4) 


者 @1,…, yw 中 有 相同 的 , 则 以 三 ,…, 5 记 其 中 的 不 同 值 ， 且 设 
1, “0*, ON 中 有 Ai 个 Di As 个 zs， ”3 Ai 个 D 则 也 易 算出 
1. 无 放 回 时 


P(Xs=00 ,NN Nt D1/ 


[ENCN—1).…(N— n+1)], (1.5) 
2. 有 放 回 时 
P(Xi=%1, ,=n) = NPNE VAN (1.6) 
其 中 2 …。 za 有 2 个 为 ,ma 个 沟 了 ot 个 为 也 


在 以 上 这 种 性 质 的 几 个 例子 中 ， 样 本 分 布 在 下 述 意义 上 说 是 
确切 的 。 就 是 说 , 它 是 根据 严格 的 概率 计算 得 到 ,不 含有 什么 假定 
成 分 一 一 如 果 有 的 话 ， 那 只 在 于 . 我 们 楼 假 定 “ 每 一 个 体 有 同等 机 
会 被 抽出 这 一 点 , 是 可 以 严格 实现 的 .在 具体 实施 中 , 可 以 采用 
随机 数 表 之 类 的 工具 去 做 . 虽 则 完全 严格 地 实现 “同等 机 会 ”也 许 
不 可 能 ,但 经 过 精心 计划 和 实施 的 抽样 程序 , 可 以 “基本 上 ”实现 这 

天， 


一 点 , 其 偏差 从 应 用 角度 看 可 以 忽略 ， 除了 这 几 个 便 子 所 代表 的 
那些 情况 外 , 样本 分 布 的 确定 都 带 有 不 同 程度 的 假设 成 分 , 有 时 其 
至 就 是 一 种 假设 .当然 ， 这 种 假设 往往 有 一 定 的 理论 或 经 验 的 依 
据 , 但 数学 上 的 简单 性 往往 也 是 一 个 因素 .看 以 下 的 例子 . 

例 1.4 为 估计 一 物件 的 重量 4, 用 一 架 天 平 将 它 重复 种 量 
次 (也 可 以 用 不 同 的 天 平 ,但 精度 相似 ), 结果 记 为 了 1，…， 了 及 ,这 
就 是 样本 . z 

要 定 出 样本 且 , *…, 且 , 的 分 布 ， 就 没有 前 几 个 例子 那 种 简 
单 的 算法 ， 而 只 能 是 一 系列 假定 的 结果 . 首先， 假定 各 次 种 量 是 
“独立 ”地 进行 的 、 这 可 理解 为 : 某 次 程 量 的 误差 大 小 ,不 受 其 他 次 
秤 量 结果 的 影响 ， 这 样 , 节 1,…, 邓 , 是 相互 独立 的 随机 变量 .其 
次 , 假定 各 次 秤 量 是 在 “同样 条 件 下 ”进行 的 。 这 可 理解 为 , 每 次 用 - 
同一 架 天 平 ,或 各 次 使 用 的 天 平 在 精度 上 可 认为 一 样 ; 每 次 秤 量 由 
同一 个 人 操作 , 或 操作 者 虽 不 同 , 但 他 们 的 技术 水 平 可 认为 相同 ; 
每 次 操作 时 ， 操 作者 都 是 专心 贯 注 ， 且 周围 环境 条 件 也 可 认为 一 
样 ,等 等 .这 些 条 件 在 实际 中 也 许 不 能 彻底 做 到 ,但 我 们 假定 偏离 
很 小 以 致 其 影响 可 忽略 不 计 ， 在 这 个 假定 下 , 卫 1,…, 及, 中 每 一 
个 有 同样 的 分 布 、 因此， 样本 民 ,，…， 并 ,是 吨 个 独立 同 分 布 的 
随机 变量 . 

这 样 一 来 ， 为 确定 (并 :，…， 互 ,) 的 概率 分 布 ， 只 须 给 出 其 中 
一 个 ,例如 下! 的 概率 分 布 。 在 此 就 要 考虑 到 秤 量 误差 的 本 性 . 这 
种 误差 一 般 是 由 大 量 的 、 彼 此 独立 地 起 作用 的 随机 性 误差 选 加 而 
成 , 每 : -个 起 的 作用 不 大 .由 概率 论 中 的 中 心 极限 定理 可 知 ,这 种 
误差 近似 地 服从 正 态 分 布 . 再 假定 天 平 没 有 系统 性 误差 , 则 可 进 
一 步 假定 此 正 态 分 布 有 均值 0， 于 是 ， 可 以 把 和 ( 它 等 于 物件 重 
量 a 加 上 秤 量 误差 ) 的 概率 分 布 定 为 正 态 术 (%, o”). 方差 o? 反 
映 天 平 的 精度 , 而 样本 ( 王 1,…， 了 及。) 的 分 布 有 概率 密度 


fv, 7, Ln; 90] 一 (V2mc )™"exp| — 2 Zoo)’]. 
(1.7) 


。- 16。 


在 本 例 中 , 为 得 出 分 布 代 .7), 所 引入 的 假定 有 两 种 类 型 一 种 
是 导出 “xz，…， 王 。 为 独立 同 分 布 ” 的 假定 ， 它 可 以 说 与 前 几 个 
例 中 ,“ 每 一 个 体 有 同等 机 会 被 抽出 ”的 假定 相当 . 另 一 种 是 邓 1 为 
正 态 W(c, c3) 的 假定 .这 一 点 依据 问题 的 性 质 ， 概 率 论 的 理论 ， 
以 往 的 经 验 等 等 , 而 终 不 免 是 一 种 多 少 带 有 任意 性 的 假定 。 这 就 
是 本 例 与 前 面 三 个 例子 不 同 的 地 方 . 

例 1.5 某 工厂 生产 一 种 电子 元 件 ， 如 晶体 管 ， 由 于 在 大 批 
生产 中 种 种 随机 性 因素 的 干扰, 所 生产 的 晶体 管 寿命 不 同 ， 我 们 
想 抽取 个 作 试 验 , 用 以 估计 其 平均 寿命 . 

设 用 一 定 的 方法 抽取 了 个 元 件 ， 将 其 在 正常 (或 指定 ) 的 条 
件 下 使 用 ， 直 到 全 部 % 个 都 失效 为 止 ， 测 得 这 个 的 寿命 分 别 为 
开 b， …， 互 。 这 就 是 样本 ， 

要 确定 (下 1,…, 五,) 的 分 布 ， 要 作 一 系列 的 假定 ， 首 先 , 假 
定 这 工厂 的 生产 量 很 大 ， 生 产 条 件 在 所 考察 的 那 自 时 间 内 基本 上 
是 稳定 的 ， 又 这 ” 件 产 品 的 抽取 ,尽量 照顾 到 不 是 在 同一 天 ,同一 
个 班次 或 同一 个 人 的 产品 , 而 是 在 时 间 、 空间 等 方面 有 足够 的 “ 跨 
度 ”， 则 有 理由 假定 卫 !, …, 卫 , 是 独立 且 同 分 布 的 随机 变量 ， 这 
一 点 与 例 1.4 相似 . 

为 要 确定 下: 的 分 布 , 则 须 作 进一步 的 假定 .例如 , 假定 寿命 
有 无 后 效 性 ， 即 在 元 件 已 使 用 了 长 为 + 的 一 段 时 间 尚 未 失效 的 条 
件 下 ,元 个 至 少 尚 能 使 用 一 段 时 间 s 的 概率 ， 不 依赖 于 志 又 设 当 
元 件 在 时 刻 # 尚未 失效 时 ， 它 在 世 , i-+ 人 忽 的 时 间 段 内 失效 的 概 
率 ， 存 24t 十 0[44) 的 形式 (其 中 lim 0( 妇 /t=0, 和 >0 为 一 党 
数 )， 则 在 概率 论 中 证 明了 (X41<e) 一 1-e-”%， 当 w>0 ( 当 w<0 
时 , 此 概率 当然 为 0), 即 有 指数 分 布 。 也 可 以 写成 概率 密度 的 形 
式 : 也 1 有 概率 密度 

Ca， 和 ) 一 和 2 , 当 w>0; (1.8) 

一 0 , 当 w<<0. 
在 本 例 中 ,样本 (及 1, …， 叉 ,) 的 分 布 是 用 严格 的 概率 论 方法 
s jf» 


推出 的 . 但 是 ,推导 所 根据 的 假定 ,在 实际 问题 中 至 多 只 能 是 近似 
地 成 立 , 因此 ,对 样本 分 布 的 规定 也 多 少 只 是 一 种 假定 。 当 进行 理 
论 研 究 时 ,我 们 是 以 这 种 假定 严格 满足 为 出 发 点 。 因 此 ,建立 在 这 
一 点 上 的 理论 和 方法 是 否 在 一 特定 情况 下 可 用 ， 就 要 具体 考察 该 
特定 情况 下 的 条 件 ， 

例 1.6 若 样本 是 多 维 的 〈 见 本 节 ( 一 )， 以 上 诸 鲍 的 讨论 也 
适用 . 例如 , 从 一 大 群 人 中 抽出 个 , 每 个 测 出 其 身高 和 体重 , 得 
(X11), ">, ( 玉 ，， Y.,). 这 永 是 样本 . 在 一 定 条 件 下 ， 可 假定 它 
们 独立 同 分 布 , 且 ( 肝 1, 了 1) 有 二 维 正 态 分 布 N(a, bai ai p)。 
于 是 样本 (CS 了 1),…, (了 于,, 了 ，,)) 有 概率 密度 

fm1, Yi1, "7, Vn, Yn; , 8, of, 02, p) 
n wi — a)? 
-De 
27 (wi 0) Nb 一 已) 
_ 27(2 一 OIC 一 0) 十 )]. (41.9) 
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(三 ) 统计 模型 

在 $1.1 中 我 们 多 次 提 到 “ 统 补 模型 "这 个 词 ， 现在 很 容易 解 
释 其 确切 含义 ; 所 谓 一 个 问题 铬 统计 模 殖 ,就 是 指 研究 该 问题 时 所 
抽样 本 的 分 布 , 也 常 称 为 概率 模型 或 数学 模型 . 由 于 模型 只 取决 
于 分 布 ， 故 常 把 分 布 的 名 称 作 为 模型 的 名 称 。 这样， 偏 寺 .4 和 倒 
1.6 中 的 模型 可 称 为 正 态 分 布 模型 或 正 态 模 型 ， 例 1.5 中 的 模型 
可 称 为 指数 分 布 模型 ,等 等 ， 就 上 面 提出 的 模型 定义 , 有 几 点 可 以 
解释 一 下 . 

1. 在 所 作 的 定义 下 , 模型 是 对 确定 的 样本 而 言 . 就 是 说 , 只 
有 在 明确 了 样本 的 产生 方法 ， 并 辆 之 以 必要 的 假定 ， 才 能 定 下 网 
型 。 照 这 样 看 ， 单 说 是 “问题 的 模型 ”还 不 很 合适 ， 因 为 提出 问题 
并 非 必 须 给 定 样 本 不 可 , 好比 从 10,000 农户 中 抽出 100 户 去 考察 
其 经 济 情况 那个 例子 ( 见 $14.1,( 一),2)， 问 题 可 以 是 估计 平均 年 
纯 收入 .这 问题 是 明确 的 , 如 何 抽样 , 可 以 有 种 种 方法 . 我 们 这 样 扎 
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异型 和 样本 紧密 联系 是 方便 的 ， 统计 分 析 的 依据 是 榜 本 . 从 统计 让 
上 说 ,只 有 规定 工 样 本 

2. 也 可 以 从 另 一 而 来 说 什么 时 候 给 出 了 样本 的 分 布 就 有 
了 确定 的 统计 模型 ,而 不 在 乎 问题 怎么 提 , 或 换 名 话说, 在 一 个 模 
型 之 下 可 提出 很 多 统计 问题 拿 例 芋 .4 而 言 ， 有 了 样 林 王 1 …， 
防 。, 并 规定 其 分 布 为 (1.7) 后 , 就 有 了 一 个 统计 模型 .在 这 个 模型 
下 可 提出 一 些 疝 题 , 例如 估计 物件 的 重量 <。 也 可 以 设想 : 我 们 的 
目的 不 在 于 估计 c， 而 在 于 考察 这 天 平 的 精度 如 何 . 在 统计 上 可 
以 把 这 个 问题 提成 估计 0 总 之 ， 以 上 两 点 就 是 说 久 统 计 横 型 就 


汉 统 计 模型 定义 为 样本 分 布 ， 包含 了 一 些 较 深刻 的 意思 ， 我 们 
来 仔细 申述 一 下 .第 一 , 这 表明 , 数理 统计 学 是 通过 研究 祥 本 的 分 
< 解决 所 提出 的 问题 .或 换 句 话说 , 从 统计 学 的 观点 看 ,样本 中 
的 信息 ,全 都 在 其 分 布 中 ， 因此, 这 种 信息 对 要 解决 的 问题 

由 ,用 处 多 大 , 就 要 看 样本 分 布 与 问题 是 否 有 关 , 关系 如 何 ， 

4 来 说 , 问题 是 估计 物件 重量 4a， 而 样本 的 分 布 (1.7) 确 与 


a 有 关 . 在 例 1.5 中 , 元 件 的 平均 寿命 是 分 布 (1.8) 的 均值 工 . 这 


个 值 取决 于 分 布 (1.8)、 在 这 两 例 中 ,样本 中 都 包含 了 有 关 问 题 的 
有 用 信息 .以 后 将 看 到 ,在 包括 这 两 个 例子 在 内 的 一 些 情况 中 , 我 
们 甚至 可 以 在 一 定 的 意义 下 定量 地 衡量 这 信息 量 的 大 小 、 这 样 ， 
在 $1.1 中 多 次 提 到 的 “有 效 地 收集 数据 ”一 语 ， 也 就 可 给 以 更 确 
切 的 解释 “有效” 是 指 所 得 样本 的 样本 分 布 中 ， 能 包含 尽 可 能 多 
的 ,与 问题 有 关 的 信息 . 

第 二 , 由 于 模型 就 是 样本 分 布 , 故 很 多 性 质 不 一 样 的 问题 , 可 
归 入 到 同一 种 模型 下 .例如 ,所 有 涉及 到 量 测 误差 的 问题 , 只 要 例 
1.4 中 串 述 的 、 假 定 误 差 服 从 正 态 分 布 的 理由 成 立 , 则 都 可 以 用 模 
型 人 L.7)、 只 要 把 这 个 模型 的 统计 问题 研究 清楚 了 , 就 可 用 于 解决 
许多 专业 部 门 的 问题 ， 这 就 是 数学 的 抽象 ， 以 此 之 故 ， 可 以 说 数 


1) 更 形 切 地 说 ,应 是 指 统计 推断 而 言 , 因为 统计 学 也 处 理 收集 样本 的 问题 。 
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理 统计 学 的 任务 ， 就 是 研究 秘 种 统计 模型 中 所 能 提出 的 种 种 统计 


问题 、 它 形式 上 可 以 从 任何 具体 的 专业 领域 中 超脱 出 来 而 ! 
纯 数 学 的 。 当 然 ， 选 定 有 意义 的 统计 模型 ， 提 出 有 意义 的 统计 ， 
题 ,对 结果 作 恰当 的 解释 和 利用 , 这 些 都 离 不 开 实际 背景 

第 三 , 由 这 个 提 法 看 出 数理 统计 学 和 概率 论 的 极 密切 的 关系 
研究 数理 统计 学 主要 的 工具 是 概率 论 . 在 此 有 一 个 问题 需要 明 
确 , 既然 统计 模型 就 是 概率 分 布 ,而 概率 分 布 又 是 概率 论 的 主要 研 
究 对 象 ,那么 ,数理 统计 学 和 概率 论 还 有 何 区 别 ? 可 否 把 数理 统计 
学 看 成 概率 论 的 一 部 分 ? 我 们 说 不 能 ,尽管 二 者 关系 如 此 密切 , 它 
们 还 是 两 个 独立 的 .平行 的 学 科 , 主要 原因 是 所 研究 的 问题 的 性 质 
不 同 。 拿 例 工 .4 来 说 , 正 态 分 布 在 概率 论 中 有 很 深入 的 研究 ,但 目 
的 只 在 于 弄 清 “正太 分布 有 何 数学 性 质 "。 而 数理 统计 学 所 关 六 
的 , 则 是 如 何 用 样本 去 推断 这 分 布 中 未 知 的 成 分 , 即 & 和 c+ 
题 ， 这 有 点 象 解析 几何 与 代数 的 关系 : 研究 解析 几何 使 )? 
具 , 但 解析 几何 因 有 其 独特 问题 而 自 成 一 学 科 ， 更 具体 一 
论 中 研究 了 许多 分 布 的 性 质 , 这 些 分 布 都 可 作为 统计 模型。 
论 所 提供 的 有 关 这 些 分 布 的 知识 ， 可 用 于 解决 关于 这 些 分 和 
计 问 题 。 以 此 之 故 有 一 种 说 法 : 概率 论 是 统计 的 基础 ,统计 是 概率 
论 的 一 种 应 用 .这 个 说 法 基本 上 正确 地 概括 了 二 者 的 关系 。 


(四 ) 总 体 

总 体 又 称 母 体 ， 在 统计 上 ,这 个 词 常理 解 为 “研究 的 问题 所 涉 
及 的 对 象 的 全 体 的 集合 "。 总 体 中 的 每 个 成 员 则 称 为 个 体 或 单元 . 
从 总 体 中 按 一 定 的 规则 抽出 一 些 个 体 的 行动 ， 称 为 抽样 . 所 抽 得 
的 个 体 称 为 样本 . 

拿 例 1.1 来 说 , 因 问 题 只 在 估计 这 批 产品 的 废品 率 ( 而 不 及 其 
他 ), 故 总 体 就 是 这 批 产 品 , 抽出 的 ww 个 产品 就 是 样本 。 这 里 与 本 
节 ( 一 ) 中 所 述 有 一 点 小 小 的 区 别 . 按 这 里 的 说 法 , 样本 是 产品 本 


] 身 , 面 按 ( 一 ) 的 说 法 ,， 刚 是 它们 的 特征 (数字 工 或 0) 在 问题 已 明 


确 时 , 这 一 差别 自 无 关 宏 则 .同样 , 在 例 工 .8 中 , 总 体 是 该 地 区 全 
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部 六 个 农户 的 集 , 每 一 农户 是 个 体 ， 而 样本 包含 ”个 农户 .在 类 

对 此 类 例子 的 问题 中 , 总 体 是 由 有 限 个 “看 得 见 、 摸 得 着 的 人 或 
_ 蝎 成 ,一 切 都 比较 好 理解 

再 看 例 1.4， 在 这 里 总 体 该 如 何 理解 ? 这 就 不 象 以 上 诸 例 那 
么 清楚 .实际 上 ,在 此 例 及 类 似 的 情况 下 ,总 体 并 非 现实 存在 的 对 
象 的 集 ， 而 只 是 我 们 头脑 中 的 抽象 ; 我 们 把 总 体 理解 为 “一 切 可 能 
出 现 的 释 量 结果 的 集 . 如 果 愿 意 的 话 , 你 可 以 这 样 想 , 若 在 尽 可 
能 间 样 的 条 件 下 把 这 物件 无 尽 期 地 秤 量 下 去 ， 则 会 得 到 无 数 的 秤 
量 结果 。 把 它们 一 一 记录 在 一 本 有 无 穷 多 页 的 书 上 , 这 本 书 就 是 
问题 的 总 体 ， 简化 一 些 , 我 们 定 出 一 个 区 间 fa 引 , 它 包 含 了 一 切 
可 能 的 释 量 结果 ， 就 以 这 个 区 间作 为 总 体 , 比方 说 , 你 可 以 万 无 一 
失地 取 [o, 可 为 [0, so), 以 至 (一 co, co)。. 这 区 间 内 每 一 个 数 都 是 
布 和 个 体 ,而 样本 仍 可 理解 为 总 体 的 一 部 分 .但 是 , 按 这 样 方式 定 
所 包 仿 性 就 失掉 了 其 特性 . 只 要 所 考察 的 指标 取 实 数值 ,我 们 总 可 
是 否 有 玉 取 为 (一 co, ce)。 我 们 还 不 如 就 从 样本 分 布 (1.7) 出 发 , 
使 例 1 了 什么 总 体 。 
.na 是 ,在 统计 著作 中 常 引进 总 体 分 布 这 一 概念 , 这 个 概念 的 引 
入 ,使 得 在 某 些 重要 情况 下 ,从 总 体 出 发 比 从 样本 出 发 有 其 方便 之 
处 .我们 把 总 体 分 布 定义 为 当 祥 本 大 小 为 工时 的 样本 分 布 。 就 是 
说 , 若 只 观察 一 次 或 只 做 一 次 试验 , 则 所 得 结果 , 即 入 1 的 概率 分 
布 ,就 是 总 体 分 布 、 拿 例 1.4 和 例 1.5 来 说 , 总体 分 布 分 别 是 正 态 
和 ka 0”) 及 指数 分 布 (1.8)， 如 果 这 样 定义 总 体 分 布 并 以 瓦 来 记 
它 , 则 当 有 一 个 狂 自 这 总 体 的 大 小 为 n 的 独立 同 分 布 样本 于 1 
…, 辽 , 时， 可 立即 写 出 样本 分 布 为 (m4)F(wa)… 了 (ws)、 这 样 ， 
就 可 以 把 统计 模型 定义 为 总 体 分 布 互 ， 这 禅定 义 避 免 了 把 模型 定 
义 与 样本 大 小 %% 关 联 起 来 , 而 显得 较 简单 。 由 于 独立 同 分 布 样本 
是 统计 中 最 常 考虑 的 对 象 , 总 体 分 布 是 一 个 有 用 的 概念 . 
引进 总 体 分 布 这 个 晤 念 , 也 解决 了 上 面 提出 过 的 一 点 , 即 如 果 

单 看 指标 值 的 集 ， 则 总 体 都 可 取 为 (一 co, co) 而 失掉 其 特性 ， 现 

在 可 以 说 : 总 体 的 特性 由 总 体 分 布 来 刻 划 ， 因 之 在 统计 上 , 常 把 总 
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体 和 总 体 分 布 视 为 同 义 语 , 也 根据 总 体 分 布 的 类 型 来 称呼 总 体 , 如 
例 1.4 中 总 体 可 称 为 “ 正 态 总 体 ”, 或 “总 体 N(g, o*)”。 当 总 体 分 
布 为 了 而 有 1,…, 尺 。 为 独立 同 分 布 样本 时 , 常 称 卫 1, …， 祥 。 是 
从 总 体 百 中 抽出 的 简单 随机 样本 或 独立 随机 样本 ,并 记 为 


不 ~ ( 工 .10) 
若 分 布 有 密度 f, 则 也 常 记 为 
; 1 ~ (1.11) 


另 一 种 在 统计 上 常用 的 说 法 如 下 ; 我 们 引进 一 个 抽象 的 记号 , 例如 
闷 , 来 代表 所 考察 的 指标 . 如 在 例 1.4 和 1.5 中 , 记号 五 分 别 代 
表 “ 秤 量 结果 ”与 “元 件 寿 命 "， 总 不 是 样本 , 因为 它 并 不 是 由 实际 
观察 或 试验 产生 , 而 只 是 我 们 所 考察 的 量 的 一 个 记号 .我 们 把 六 
看 成 一 个 随机 变量 , 其 分 布 就 是 总 体 分 布 了。 这样 ,我 们 可 以 把 总 
体 就 看 成 是 变量 卫 , 而 样本 及 1, …， 闷 是 下 的 观察 值 ， 记 为 
1 …, 蔗 , 必 太 . (1.12) 

(1.10)~(1.12) 这 三 个 记 法 表示 同一 个 意思 ， 样 本 1,…*, 
独立 同 分 布 ， 每 个 样本 (如 于 :1) 的 分 布 与 了 的 分 布 同 ， 即 有 分 布 
五 ,或 密度 了 

在 许多 情况 下 , 整个 样本 并 非 独立 同 分 布 ,但 可 以 自然 地 分 成 
几 部 分 , 每 部 分 都 是 独立 同 分 布 . 看 下 面 的 例子 . 

例 1.7 两 个 物件 的 重量 4、2 未 知 , 为 比较 < 和 4, 我 们 在 辣 
一 架 天 平 上 把 它们 分 别 释 mw 和 次， 结果 分 别 记 为 1, …， 坟 nm 
和 Fi, ……, YY,. 

全 部 样本 是 (了 :，…， 碟 mw 了 1,…, 了 ，,)。 假定 例 1.4 中 陈述 
的 那些 条 件 适合 , 则 有 理由 认为 且 1，…， 芋 m, 了 1，…， Ys 这 mn 十 
n 个 变量 相互 独立 , 及 ;服从 正 态 分 布 (a, o”) 而 了 ;服从 正 态 分 
布 N(5,o”)， 在 此 及 1, …, 互 m 同 分 布 , 了 …， 了 了 同 分 布 ,但 全 
体 样本 不 同 分 布 。 象 这 类 的 例子 ， 我 们 不 如 采取 这 样 的 看 法 ， 有 
两 个 总 体 ， 分 别 以 脏 , 了 记 之 ， 总体 分 布 分 别 是 六 (gw, o ) 和 
N(5, o”)， 样 本 也 分 为 两 组 ， 即 (Xi …， Xm) 和 (Ys 了、 
它们 分 别 抽 自 总 体 芒 和 了 .可 记 为 : 


ys 所 
二 92 三 ~ 
~ 


六 1， ” 人 mn 人 ~ 三 ; 了 2， 了 了 人工。 (1.18) 
在 统计 上 称 这 种 问题 为 “两 样本 问题 ”当然 , 称 之 为 两 总 体 问 题 也 
未 尝 不 可 )。 类似 地 可 定义 多 样本 问题 。 


$1.3 统计 推断 


在 81.1 中 介绍 数理 统计 学 的 任务 时 ， 我 们 谈 到 了 收集 和 使 
用 数据 这 两 个 方面 .并 说 明 , 所 谓 “ 使 用 ,即将 样本 用 于 解决 历 提 
出 的 问题 , 作出 一 定 的 结论 , 叫 统计 推断 。 现 在 我 们 可 对 此 作出 更 
仔细 而 严密 的 解释 。 本 节 的 另 一 任务 是 , 通过 一 些 例子 说 明 统 计 
推 上 新 的 种 种 形式 ,借以 介绍 数理 统计 学 的 若干 主要 分 支 。 


(一 ) 样本 分 布 族 , 参数 和 参数 空间 
在 $1.2( 二 ) 中 我 们 反复 申述 并 举例 说 明了 这 样 的 观点 : 统计 
模型 就 是 样本 分 布 . 后 者 包含 了 样本 中 的 全 部 信息 ; 所 要 解决 的 问 
题 必 须 与 样本 分 布 有 某 种 关联 ， 如 在 例 1.4 和 例 工 .5 中 , 和 若 知 道 
了 c 或 人 则 问题 已 解决 而 没有 必要 抽样 了 . 正 因 为 & 和 入 未 知 ， 
才 需 要 通过 抽样 去 了 解 它 。 在 这 两 个 例子 中 ,抽样 的 目的 都 是 为 
了 解 出 现在 抽样 分 布 中 的 某 些 未 知 常数 . 
在 统计 上 , 把 出 现在 样本 分 布 中 的 未 知 常数 称 为 参数 . 如 在 
例 1.4 中 , 问题 在 于 估计 c, @ 当然 未 知 ， 蚌 一 个 参数 .至 于 c 是 
否 是 参数 , 则 要 看 情况 . 车 我 们 对 这 天 平 的 精度 已 有 足够 的 了 解 ， 
而 可 以 给 出 o 的 值 ( 如 9 一 1)， 则 co 不 是 参数 . 若 并 无 足够 了 解 ， 
甚至 问题 就 在 于 估计 天 平 的 精度 ， 则 o 自然 是 参数 . 这 时 可 称 
(&, 0 ) 为 参数 向 量 . 例 1.5 中 的 参数 为 入 , 而 例 1.6 有 五 个 人 参数， 
W, b, Ti1, Ga, p, . 
在 一 具体 问题 中 ,样本 分 布 中 的 参数 所 取 的 值 虽 未 知 ,但 根据 
该 参数 的 性 质 ， 可 以 给 出 参数 值 所 在 的 范围 。 这 个 范围 叫做 参数 
空间 .如 在 例 1.4 中 ,车 gw、o 都 是 参数 ， 由 @ 的 性 质 知 它 必 大 于 
0。 至 于 w, 在 本 问题 中 作为 物件 的 重量 , 也 只 能 大 于 0， 因此 参数 
。23 。 


空间 可 取 为 
@ 一 {(c, o).o>0, o>0}, 

即 平面 上 的 第 一 象限 。 根据 我 们 事前 的 了 解 , 也 可 能 把 本 问题 
参数 空间 限制 在 一 个 更 小 的 范围 内 ， 如 {(w, 0): 0<a<o<as、 
co, 0<z<ooj、 参数 空 间 的 这 种 取 法 表明 : 在 没有 进行 试验 (用 
天 平 秤 ) 之 前 , 我 们 就 有 把 握 肯定 物件 重量 不 小 于 ax 也 不 大 于 aa， 
同样 ,在 例 1.5 中 参数 空间 是 @@= {X:. 和 > 0}, 而 在 例 1.6 则 是 
BO={(g, b, o1, ga, P). a>0, 8>0, o1>0, os>0, 1p| 1}, 
1p| < 是 根据 p 是 身高 与 体重 的 线性 相关 系数 , 而 后 者 必 在 一 1 
与 1 之 间 . 在 本 例 中 我 们 有 把 握 肯 定 p 非 负 , 故 取 p>0 也 可 以 . 

样本 分 布 中 既然 包含 了 一 些 未 知 的 参数 , 那么 , 可 能 的 样本 分 
布 就 不 止 一 个 ,而 是 一 个 分 布 族 ， 例 如 , 例 1.5 的 样本 分 布 族 是 

{f(r, %): A>0}. 

要 注意 此 式 中 wz 和 和 的 质 的 区 别 ; 和 \ 是 未 知 常数 , 它 的 每 一 个 可 能 
值 对 应 于 一 个 具体 的 样本 分 布 ，z 只 是 密度 函数 中 的 一 个 流动 变 
量 , 有 如 定 积分 中 的 积分 变量 , 无 其 特别 含义 . 

现在 我 们 可 以 把 $1.2 (三 ) 中 所 给 的 统计 模型 的 定义 稍稍 确 
切 化 一 点 : 统计 模型 就 是 样本 分 布 族 ， 这 一 点 的 实际 意义 在 于 ; 样 
本 分 布 族 , 连同 其 参数 空间 , 从 总 的 方面 定 出 了 问题 的 范围 .也 可 
以 这 样 说， 分布 族 反映 了 因 我 们 对 所 研究 问题 以 及 抽样 方式 的 知 
识 和 规定 , 我们 能 把 问题 确定 ? 到 何 种 程度 .分 布 族 愈 小 ,确定 的 
程度 愈 高 ， 这 一 般 就 意味 着 愈 有 可 能 作出 更 为 精确 和 可 靠 的 结 
论 ， 拿 例 1.4 来 说 ， 设 问题 在 于 估计 重量 a， 若 反映 天 平 精度 的 
o 未 知 , 则 分 布 族 大 些 . 车 已 知 (例如 co 一 二, 则 分 布 族 小 些 . 可 
以 想象 有 关 天 平 精 度 的 知识 , 对 信 计 4 是 有 用 的 。 这 可 以 说 成 
在 知道 o 时 ,估计 < 的 问题 更 确定 一 些 . 
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1) 在 此 要 注意 ，“ 确 定 ” 一 词 不 是 指 问题 是 不 是 提 清 楚 了 。 问题 提 法 总 应 是 “请 
楚 ” 的 ， 这 里 意思 是 ; 问题 中 已 知 的 成 分 傅 多 , 问题 就 愈 确定 , 推断 未 知 的 成 分 
就 愈 容易 。 


一 部 分 。 这 种 情况 下 的 统计 问题 称 为 参数 统计 问题 . 在 有 些 问题 
-市 和 情况 较 此 复杂 ,我 们 举 一 个 例子 ， 
节 、 例 1.8 我 们 再 来 考察 例 1.4 中 估计 物件 重量 a 的 问题 ， 若 
我 们 对 秤 量 的 随机 误差 的 性 质 不 其 了 解 , 或 者 说 , 有 理由 怀疑 , 例 
1. 生 中 所 论述 的 、 导 致 随机 误差 服从 正 态 分 布 的 根据 可 能 不 成 立 ， 
则 我 们 不 能 认定 样本 分 布 为 正 态 的 . 但 可 能 有 根据 作 以 下 的 一 般 
性 假定 : 秤 量 的 随机 误差 有 均值 0( 天 平 无 系统 误差 ), 随机 误差 的 
分 布 关于 0 对称 , 且 有 密度 函数 。 又 假定 , 例 1.4 中 所 述 关 于 样本 
对 1,…, 卫 。 独立 同 分 布 的 道理 仍 有 效 ， 则 ( 卫 1,…*， 了 及 ,) 的 分 布 
有 概率 密度 
f 01— of va — 0) fm — 0), (1.14) 
其 中 < 为 一 个 实 参 数 , 取 值 于 (0, 0)，f 为 一 个 概率 密度 函数 , 满 
足 条 件 
J(- 四 = 对 一 切 sE(-co, co), | lee)do<eo 
(1.15) 
在 这 里 ,分 布 (1.14) 中 的 未 知 成 分 有 二 ， 一 是 实 参数 4, 另 一 是 密 
度 f. 后 者 不 是 实 参数 ， 它 变化 的 范围 由 条 件 (1.15) 规 定 。 整个 
来 说 ,样本 分 布 的 参数 不 能 由 有 限 个 实 参 数 来 刻 划 , 参数 空间 也 不 
是 欧 氏 空间 的 一 部 分 ， 若 以 多 记 由 以 .15) 所 确定 的 概率 密度 的 
集 , 则 形式 上 可 把 “参数 空间 ”定义 为 
={(a, f):0>0, fEF}. (1.16) 
这 类 情况 ( 即 参 数 空间 不 是 欧 氏 空间 的 一 部 分 ) 下 的 统计 问题 称 为 
< 非 参 数 统计 问题 . 


(二 ) 统计 推断 
”有 了 以 上 的 准备 ， 现 在 可 以 来 较 确切 地 回答 什么 是 统计 扒 断 
, 间 题 。 为 解决 具体 问题 而 抽样 ,样本 分 布 族 规定 了 问题 的 统计 
《型 ,样本 的 具体 数值 供 实际 作 统 计 推 断 之 用 ， 推 断 什 么 ?就 是 推 
,样本 分 布 中 的 未 知 参数 。 根据 问题 的 需要 , 可 以 只 对 一 部 分 未 
。25 。 


知 参 数 作 推断 , 推断 的 形式 也 根据 问题 的 需要 而 不 同 . 如 在 例 1.4 
中 , 问题 是 要 估计 物 重 g， 用 统计 的 语言 , 就 是 依据 样本 子 1,…， 
甩 , 对 分 布 (ac9) 中 的 参数 ea 作出 推断 ， 这 个 推断 的 具体 内 容 
就 是 依据 样本 及 1，-…， 斑 , 算出 一 个 数 , 以 之 作为 4 的 估计 值 . 也 
可 能 问题 只 要 求 判定 “ 物 重 & 是 否 超 过 1 公斤 ”， 则 推断 的 内 容 是 
建立 一 个 法 则 , 按 这 个 法 则 ， 对 每 组 具体 样本 卫 ;, …, 也,， 在 “4 
是 超过 1 公斤 ”和 “6g 不 超过 1 公斤 ”这 两 个 判定 中 采取 一 个 。 本 
问题 不 直接 涉及 oa, 故 没 有 推断 e 的 问题 . 

“推断 ”一 词 在 日 常 使 用 中 ,是 指 从 一 定 的 条 件 和 假定 出 发 , 按 
照 一 定 的 方法 或 规则 , 而 得 出 未 知事 物 的 某 种 结论 。 统计 推断 也 
是 这 种 模式 “未知 事物 ”就 是 未 知 参 数 , “一 定 的 条 件 和 假定 ”就 是 
样本 和 统计 模型 . 

大 们 常 把 统计 推断 说 成 是 由 祥 本 推断 总 体 ， 或 由 部 分 推断 束 
体 。 这 是 在 所 掌握 的 知识 不 完全 的 情况 下 , 所 作 的 一 种 归纳 性 的 
推理 ， 不 同 于 在 几何 学 中 证 明 “ 等 腰 三 角形 底 角 相等 ”或 在 代数 学 
中 求 一 个 二 次 方程 的 根 、 在 这 些 问题 中 , 推理 的 步 又 在 有 关公 理 
体系 之 下 是 公认 的 , 结果 是 确切 的 , 统计 推断 则 不 然 。 设 想 从 一 批 
10, 000 件 产品 中 抽出 100 个 以 估计 整 批 产品 的 废品 率 , 我 们 掌握 
的 知识 很 不 完全 -一 有 9900 件 的 情况 全 然 未 知 , 这 上扬 然 就 排除 了 
通过 一 种 严格 的 推理 以 得 出 正确 结果 的 可 能 性 ， 在 各 种 活动 领 
域 , 以 至 在 日 常生 活 中 , 人 们 都 常 面临 这 样 的 情况 . 掌握 的 知识 不 
z [学 全 但 和 要 作 结论 统计 推断 问题 的 特点 在 于 ; 所 掌握 的 这 部 分 

知识 (样本 )， 通 过 概率 的 方式 与 整体 发 生 了 一 种 有 严格 数学 意义 
的 联系 ， 这 种 联系 可 以 使 统计 推断 能 提成 一 定形 式 的 数学 问题 ， 
而 不 能 改变 这 个 根本 之 点 - 己 - 统 计 推 断 的 结果 不 能 保证 丕 错 - 如 
在 例 1.4 中 估计 物 重 4， 有 了 样本 以 后 ， 可 以 用 种 种 方法 ， 例 如 
$1.1 (一 )3 中 给 出 的 几 种 方法 ,去 估计 g， 但 我 们 不 仅 不 -能 保证 
这 些 以 及 其 他 任何 方法 估计 的 结果 恰 为 m% 也 无 法 保证 绝对 不 会 
发 生 较 大 的 偏差 ， 在 判定 & 是 否 超过 一 公斤 的 问题 中 , 不 论 用 什 
么 方法 也 无 法 保证 不 会 错 判 . 
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但 这 样 就 产生 一 个 问题 : 统计 推 斯 有 什么 意义 ? 统计 推 其 , 以 
至 于 数理 统计 学 ,能 否 竺 鼠 一 门 科学 ? 回答 是 肯定 的 ,理由 在 于 下 
面 两 点 : 1. 虽然 不 能 傣 证 在 每 一 具体 和 情况 下 所 作 的 统计 扒 新 不 
错 , 但 合用 概率 论 的 方法 , 可 以 给 出 种 种 有 意义 的 指标 , 去 衡量 推 
断 的 正确 程度 。 这 可 以 计算 出 来 比方 说 ， 在 例 1.4 估 计 & 的 问 


题 ,在 所 设 正 态 模 型 下 , 若 用 样本 的 算术 平均 值 zj 一 六 时 im 去 信 


计 %, 则 我 们 可 算出 :5 与 正确 值 a 的 偏离 超过 给 定 的 数 e>0 的 机 
会 有 多 大 ， 这 个 宙 会 , 即 概率 P(| 于 一 4|>>o), 可 作为 5 这 个 推断 
的 正确 性 的 一 个 合理 指标 (c 为 容许 的 误差 限 )， 在 此 ， 我 们 进 一 
步 明 确 了 数理 统计 学 与 概率 论 的 密切 关系 ， 不 仅 统计 问题 的 提 法 
有 赖 于 概率 论 , 统计 推断 的 方法 结果 的 表述 形式 , 以 及 衡量 一 个 
统计 推断 的 优 劣 等 , 都 离 不 开 概率 论 ， 2. 统计 推断 的 数学 理论 是 
一 种 严整 的 理论 , 符合 现代 数学 的 严格 性 标准 。， 这 与 统计 推断 的 
结果 在 具体 问题 中 可 能 有 错 是 两 回 事 ， 还 是 拿 例 1.4 估计 < 的 问 
题 来 谈 ， 在 $1.1 (一 ) 8 中 我 们 提出 了 三 种 合计 方法 ， 那 一 个 最 
好 ?在 什么 意义 下 最 好 ? 可 以 用 严格 的 数学 方法 证 明 ; 在 种 种 合理 
的 优良 性 准则 之 下 , 当 统计 模型 确 为 正 态 时 , 样本 算术 平均 这 个 估 
计 最 优 ， 这 是 一 个 严格 的 数学 命题 ， 不 言 而 喻 , 这 个 “最 优 ”, 必然 
是 在 整体 即 概率 的 意义 下 , 对 一 组 具体 的 数据 而 言 , 样本 算术 平均 
与 真 值 的 偏差 ,完全 可 以 大 于 其 他 两 个 估计 的 偏差 ， 

我 们 上 面 提出 的 这 两 点 也 回答 了 这 个 问题 ， 统计 推断 包含 
些 内 容 ? 归纳 起 来 有 三 点 名 是 出 种 种 具体 的 统计 推断 方法 | 和 
关 这 些 方法 的 性 能 的 种 种 数量 指标 (例如 上 文 的 P(| 于 -4|>>0); 

GE 一定 条 件 和 一 定 意义 下 寻找 最 优 的 推断 方法 ， 或 证 明 某 种 统计 
推断 方法 是 最 优 的 。 这 三 方面 当然 不 是 和 截 然 分 开 , 而 是 密切 联系 
在 一 起 的 . 

数理 统计 学 的 基础 是 概率 论 ， 统 计 推 断 从 结论 的 表述 到 优良 
性 的 刻 划 , 都 离 不 开 概率 ， 但 概率 的 本 质 是 什么 ?这 个 带 哲学 性 的 
问题 在 学 者 中 的 认识 并 不 一 致 , 而 这 并 非 与 应 用 无 关 ， 一 种 流行 
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的 、 在 直观 上 容易 理解 的 说 法 ,是 通过 频 素 去 解 缀 税率 ， 按 照 这 种 
解释 ， 如 果 说 某 一 统计 推断 方法 在 某 种 情况 下 的 正确 性 为 90%， 
其 意义 是 : 当 将 这 一 推断 方法 在 同样 情况 下 反复 使 用 大 量 次 数 时 ， 
平均 每 100 次 中 有 90 次 能 给 出 正确 的 推断 .倘若 问题 的 性 质 不 
介 许 有 什么 重复 ， 则 这 个 解释 就 失去 了 意义 ， 以 这 种 观点 去 处 理 
和 解释 统计 推断 , 就 叫做 频率 学 派 , 也 有 称 为 古典 学 流 的 ， 这 一 学 
派 在 数理 统计 发 展 的 较 早 时 期 (比方 谱 ， 本 世纪 五 十 年 代 之 前 ) 占 
据 了 统治 地 位 , 目前 也 仍 占 优势 . 但 其 他 的 学 派 , 主要 是 Bayes 学 
派 ( 见 第 五 章 ), 也 正 以 很 大 势头 发 展 起 来 , 也 还 有 若干 影响 较 小 ， 
但 也 值得 注意 的 观点 , 其 中 有 些 将 在 本 书 相应 的 地 方 提 到 . 


$1.4 ”统计 量 和 抽样 分 布 


(一 ) 统计 量 

前 几 节 中 我 们 反复 申述 了 这 样 的 观点 : 为 了 研究 一 个 问题 而 
收集 数据 ,数据 就 是 样本 .通过 确定 样本 分 布 而 建立 统计 模型 . 但 
要 具体 地 实施 统计 推断 ， 则 要 依据 表现 为 具体 数值 的 样本 。 样 本 
自身 是 一 堆 杂 乱 无 章 的 数字 , 要 对 这 些 数 字 进 行 加 工整 理 ,计算 出 
一 些 量 以 用 于 统计 推断 ， 可 以 这 样 理解 ， 这 种 由 样本 计算 出 来 的 
量 ， 把 样本 中 与 所 要 解决 的 问题 有 关 的 信息 集中 起 来 了 ， 如 在 全 
1.4 中 , 为 估计 物 重 mw 我们 可 以 使 用 样本 的 算术 平均 值 四， 或 者 
其 他 某 个 看 来 合理 的 量 , 如 在 $1.1 (一 ) 8 中 所 指出 的 几 种 , 它们 
都 是 由 样本 算出 的 ， 

在 统计 上 , 把 见 是 由 样本 工 出 的 量 称 为 统计 量 , 或 者 说 . 统计 
量 就 是 样本 的 函数 .在 此 十 分 重要 的 一 点 是 ， 统 计量 只 依赖 于 样 
本 , 而 不 能 与 任何 未 知 的 量 有 关 . 特别 是 ; 统计 量 不 能 依赖 于 未 知 
参数 ,这 一 点 从 统计 量 的 意义 看 应 该 是 显然 的 , 因为 统计 量 的 作用 
就 在 于 对 未 知 参 数 进 行 推 断 ， 在 什么 问题 中 选用 什么 统计 量 , 当 
然 要 看 问题 的 性 质 ， 党 统 地 可 以 说 ， 所 提出 的 统计 量 应 是 最 好 地 
集中 了 与 问题 有 关 的 信息 ， 这 不 见得 总 是 容易 做 到 的 .往往 最 初 
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是 从 直观 或 某 些 一 般 性 原则 考虑 提出 统计 量 ， 再 考察 它 是 否 在 革 
种 意义 下 较 好 地 集中 了 样本 中 与 问题 有 关 的 信息 量 . 

下 面 举 几 个 常用 的 重要 统计 量 的 例子 ， 

例 1.9 祥 本 均值 设 卫 1, …, 了 及 ,为 样本 , 则 


TY Xn (1.17) 


称 为 样本 均值 ， 在 样本 也 1, …, 了 , 为 独立 同 分 布 的 情况 下 ， 样 
本 均值 常用 于 估计 总 体 分 布 的 均值 ， 或 检验 有 关 总 体 分 布 均值 的 
假设 . 

例 1.10 样本 方差 设 卫 1,…, 全 , 为 样本 , 则 


(1.18) 


称 为 样本 方差 .在 样本 卫 /,…， 三 ,为 狐 立 同 分 布 的 情况 下 ， 栏 
本 方差 可 用 于 估计 总 体 分 布 的 方差 . (1.18) 式 中 的 mn 一 1 和 为 S? 
的 自由 度 ， 自 由 度 这 个 名 词 的 解释 有 三 , 1. 一 共有 n 个 数值 ,， 

“， 下, 应 该 有 呈 个 自由 度 ( 因 每 个 样本 都 可 自由 变化 ， 不 素 世 他 
样本 的 牵连 )， 但 有 一 个 自由 度 已 用 于 估计 总 体 分 布 均值 (用 总 )， 
”还 剩 % 一 1 个 自由 度 . 2, 82 是 风 个 数 筷 :; 一 况 , …， 子 , 一 及 的 平 


方 和 ,但 这 % 个 数 受到 一 个 (也 只 一 个 ) 约 束 , 即 总 (有 ,一 于 ) ~0， 


故 只 有 nm 一 1 个 自由 度 ，3. 车 以 对 一 避 下 /wn 代入 涯 CX, 一 于 )”， 
而 将 其 整理 为 二 次 型 总 cw, 卫 /ow 一 on), 则 不 难 验证 , 方 隆 4 一 

(ey) 的 秩 为 % 一 1， 自由 度 就 定义 为 这 个 秩 . 
自由 度 是 数理 统计 中 常见 的 名 词 ， 以 上 三 种 解释 ， 前 两 种 较 
形象 化 , 而 最 后 一 种 在 数学 上 最 清楚 严谨 ,适用 于 一 切 与 样本 二 次 
型 有 关 的 统计 量 . 
例 1.11 次 序 统 计量 及 与 之 有 关 的 统计 量 设 于 1， ”3 民 。 
为 样本 ,把 卫 1,…， 了 按 由 小 到 大 的 次序 排列 成 有 ww< 革 ww<< 
wh 则 (ad)， *"°, 0m)) 称 为 次 序 统计 量 . 例如 ， 若 二 1 一 
09。 


1.3， 卫 sa 一 0.7， 昼 s 一 二 .8， 则 次 序 统计 量 为 (0.7, 4.3, 1.8). 单 
个 的 和 ,或 (和 ah， ” 人 6) 的 一 部 分 ， 也 称 为 次 序 统计 量 ， 这 不 
致 引起 混 消 . 
通过 次 序 统计 量 可 定义 一 些 在 实用 上 有 重要 意义 的 统计 量 : 
荆 。 样本 中 位 数 ” 是 由 下 式 定 义 的 和 o: 
Xr), 当 为 奇数 ; 
的 ie sa ), 当 m 为 偶数 ， (1.19) 
就 是 次 序 统 计量 中 位 置 在 正中 的 那 一 个 ， 或 位 置 最 菲 中 的 那 两 个 
的 平均 ， 在 瑟 1，…， 克 。 为 独立 同 分 布 样本 时 ，m 可 用 于 估计 总 
体 分 布 中 位 数 . 若 已 知 总 体 分 布 关 于 某 点 对 称 ， 则 对 称 中 心 既是 
纪 位 数 也 是 均值 , 于 是 m 也 可 作为 总 体 分 布 均值 的 估计 . 正 态 总 
体 尝 是 一 个 例子 . 
2. 样本 儿 全 企业 可 定义 为 环 rwrbm 此 处 Lo] 天 


示 丰 名 过 忆 的 最 大 整数 . 当 2 一 至 而 ”为 奇数 时 , 此 定义 与 ( 侍 .19) 


一 致 ， 但 ”为 偶数 则 不 然 . 可 把 样本 2 分 位 数 的 定义 加 以 适当 修 
改 , 以 使 当 p 一 1/2 时 与 (.19) 一 致 、 当 nn 较 大 时 这 个 修改 是 很 有 
限 的 ,一 般 无 此 必要 .在 下 I, …， 了 X, 为 独立 同 分 布 样本 时 ， 样 本 
罗 分 位 数 可 用 于 信 计 总 体 分 布 的 bp 分 位 数 . 

8. 极 值 指 刁 (nm 和 玉 wy， 分 别称 为 样本 极 大 值 和 样本 极 小 
值 ， 样 本 极 值 在 某 些 关 于 灾害 性 现象 和 材料 试验 结果 的 统计 分 析 
中 有 用 . 如 一 定时 期 内 一 条 河 的 最 大 流量 、 最 大 地 震 震 级 、 材 料 断 
裂 强 度 等 ， 都 是 极 值 性 的 量 、 在 数理 统计 中 有 一 个 叫 极 值 统计 分 
析 的 专题 处 理 这 种 问题 ， 后 者 也 可 视 为 次 序 统 计量 的 统计 分 析 的 
一 在 极 值 统计 分 析 中 也 用 到 较 次 要 的 极 值 , 即 卫 (), 了 6@), 

oo-0， 上 wo "等 . 

4. 极 差 好 耻 o 一 全， 在 样本 了 1,…， 了， 独立 同 分 布 
时 , 极 差 可 用 于 佑 计 总 体 分 布 的 散布 程度 ， 

其 他 重要 的 统计 量 将 在 本 书 适 当 的 地 方 引 进来 。 
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(二 ) 抽样 分 布 

样本 是 随机 变量 , 有 一 定 的 概率 分 布 , 即 样本 分 布 . 统计 量 距 
是 样本 的 已 知 函 数 , 则 它 也 有 其 概率 分 布 , 且 这 个 概率 分 布 在 原则 
上 可 由 样本 分 布 定 出 。 统 计量 的 概率 分 布 称 为 (该 统计 量 的 ) 抽 样 
分 布 . 

确定 种 种 统计 量 的 抽样 分 布 ,是 数理 统计 学 的 一 个 基本 问题 . 
在 $1.1 (三 ) 中 提 到 的 及 . A. Fisher 1923 年 那 篇 著名 论文 <On 
he mathematical fonndations of stratistiesy 中， 了 Hisher 把 数理 
统计 学 的 任务 概括 为 三 条 :， 并 . “specifcation”， 即 定 模型 ， 确 定 
样本 分 布 ( 如 前 指出 的 , 在 独立 同 分 布 样本 的 场合 ,也 可 理解 为 总 
体 分 布 ).2."“estimation”, 妈 估计 ,用 样本 估计 模型 中 的 未 知 参数 . 
3. “sampling distributisw”， 即 抽样 分 布 。 这 问题 的 重要 性 是 很 
明显 的 ; 统计 推断 的 结果 取决 于 抽 得 的 样本 ,而 样本 受到 随机 性 的 
干扰 , 因而 推断 的 结果 也 是 随机 的 : 一 个 整体 上 看 来 较 好 的 推 浙 方 
法 , 在 个 别 情况 下 可 以 给 出 不 好 的 结果 .反之 亦 然 .因此 , 统计 推 
断 方法 优良 性 的 指标 只 能 是 整体 性 的 ， 即 取决 于 所 用 统计 量 的 抽 
样 分 布 。 总 之 ,要 想得到 一 种 特定 的 统计 推断 方法 的 性 能 的 全 面 
了 解 , 必须 确定 其 抽样 分 布 ， 如 在 例 寺 .4 中, 用 样本 均值 了 估计 
正 态 分 布 的 均值 6，53 与 4 的 偏差 超过 一 定 限度 的 机 会 多 大 , 即 概 
率 P(| 且 -4|>>c)， 要 算出 这 个 概率 , 需要 知道 了 的 抽样 分 布 . 

使 用 概率 论 中 的 已 知 结果 ,不 难 在 某 些 简单 的 统计 模型 中 , 定 

出 某 些 简单 的 统计 量 的 抽样 分 布 ， 举 儿 个 例子 . 

例 1.1 设 且 1,…, 互 玉 (aas)( 记 号 意义 见 (1.10)), 求 


时 的 抽 祥 分 布 ， 一 般 可 考虑 卫 一 习 mX。 mw 都 是 常数 ， 立 相当 
于 1 一 … 一 0 一 上 上 的 特例 .根据 卫 ,, …， 互 独立 同 分 布 且 站 1 
~(a, 0”), 由 概率 论 中 数 知 的 结果 , 即 知 了 的 分 布 为 入 (6 总 a 
o 忆 9, 故 辫 有 分 布 W(o 03/m), 记 为 及 ~N(&, ca/ 内 ， 
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谤 的 分 布 与 参数 ,ac 有 关 〈 某 些 统计 量 也 可 以 只 依赖 于 一 
部 分 参数 . 例如 ， 统 计量 肝 ; 一 了 ,的 分 布 为 N(0, 20， 与 a 无 
关 )。 因 此 有 的 读者 可 能 对 这 一 点 有 疑问 ; 我 们 强调 统计 量 只 依赖 
于 样本 而 与 参数 无 关 ， 为 什么 其 分 布 又 与 参数 有 关 ? 回答 是 明显 
”的 ， 统 计量 的 表达 式 固 然 只 与 样本 有 关 ， 但 样本 的 分 布依 赖 于 参 

数 . 不 仅 如 此 , 我们 还 得 强调 ; 有 用 的 统计 量 的 抽样 分 布 必须 与 参 

数 有 关 . 不 然 的 话 , 该 统计 量 就 不 包含 有 关 参 数 的 任何 信息 , 对 推 
断 这 个 参数 毫 无 用 处 . 如 上 文 ， 统 计量 耻 1 一 子 s 的 分 布 与 4 无 
关 ， 但 它 无 助 于 估计 w, 这 在 直观 上 看 很 明显 . 

例 工 .得 设 开 pw， 骂 F(o Fo 和 由 (4.8) 式 定义 ， 
求 盏 的 样本 分 布 . 

以 fnCv, 入 ) 记 了 ,一 革 1 十 … 十 卫 , 的 密度 函数 (注意 f(x, 入) 
即 为 fz, A))、。 有 ,一 Ti 十 全 ,。 用 独立 和 的 密度 公式 有 


Fle, = Flo-y, Dray, Woy 


必 . 
ED 0 


以 此 ,通过 简单 咎 积分 计算 , 不 难 用 归纳 法 证 明 


他 一 XI 革 。 
fl%, 2) ={ -Di Noe , o>0 (1.20) 
0, 当 w<0. 


因而 得 出 入 一 了 ,jn 的 概率 密度 ge(z，7X) 为 
"op 一 nan 3 v0; 
0， . 当 wee0. 
(1.21) 
例 1.14 一 批 产 品 有 六 个 ， 内 废品 到 个 ,从 其 中 抽出 ”个 ， 
铀 样 方式 是 , 1. 随机 , 无 放 回 ; 2. 随机 , 有 放 回 ， 以 全 记 抽出 的 这 
% 个 中 上 废品 的 个 数 ,T 是 一 统计 量 , 求 其 抽样 分 布 。 
这 问题 在 初等 概率 论 中 已 解决 了 , 结果 是 ， 
情况 1 超 几 向 分 布 ; 
» 32 。 


1 
gn (2, AN) =nf, nw, 和 -{ m1 


必 各 一 出 


i 


sea) ea 


(¥ 5 一 0 或 2>>5 时 ， 约定 ( | -9 
情况 2 二 项 分 布 B(n, p), p 一 MM/N， 
PC 四 -人 jzG-a 0, bes 
(1.28) 
例 1.6 设 下 …, 有 ,~ 也， 1<o<n， 求 次 序 统 计量 (区 ny 
9 的 抽样 分 布 . 
为 要 事件 { 玉 m) 二 中} 发 生 ,必须 只 须 % 个 事件 {了 :之 2}, b=1， 
…, %， 至 少 发 生 m% 个。 这 个 事件 相互 独立 且 都 有 概率 了 F(z)， 


故 PCXm<a- 蝇 jPCo) EL- PKaJ 不 准 证 明 ( 习 是 9)， 
此 式 可 改写 为 积分 形式 
P(Rm<) 二 ( 


” eG "gt (1.24) 


4 


车 卫 有 和 密度 了 , 则 于 (wm) 也 有 密度 , 且 等 于 ， 
-a(® )p" -Pan fo) 125) 
C 族 了 有 密度 厂 则 次 序 统 计时 的 联合 窗 度 为 


oz co BG VD < ny 
0 , 其 他 情况 ， 

由 此 可 得 出 任意 个 次 序 统 计量 的 联合 密度 比方 说 ， 固 定 zim 一 
2， 而 对 wy， Vm- 在 2 三 … 过 zem-p 达 4 内 积分 ， 对 wz 
Wy) 在 之 Zom4D 达 … 达 zw 内 积分 ， 不 难得 到 了 om 的 密度 
万 (o) 如 (1.25). 又 如 ， 固 定 wo 一 必 00 一 四 一 态 vw<Yy), 对 
0 WED; PEFD WD VItD 0 TD) my) 
<2 VLRGD SY YD < 内 积分 ， 不 难 算 
出 (ZX6w, 下 ww) 的 联合 密度 为 . 


gwen, """y ven)) 一 | 
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”1 . tl 
和 [TO 


Fe Dt PT Py) 
| 0 当 2 
L 当 w>y. 
(1.26) 
令 下 一 屋 0 一 全 oo 由 ( 民 .26) 不 难 推 册 三 的 密度 .事实 上 , 作 
变换 
一 站 四 一 总 一 二 人。 
道 变换 为 下 一 8, 卫 一 让 十 2， 变 换 的 Jacobi 为 4， 由 (1.26) 
得 (VV, ZZ) 的 密度 为 


I (P(t) 


glv, 2) 一 — FT Fvt+e)]"s, 
0 当 v>0; 
当 ve0. 


由 此 得 出 , 即 下 w 一 下 w， 有 密度 | gCv, z)dz， 特 别 ， 车 也 是 
R(0, 1), 即 (0, 1) 内 均匀 分 布 , 则 (2) 一 0, 2 或 1 视 2<0, 0< 
z<1 或 >1 而 定 。 对 这 个 万, 上 述 积分 不 叭 算出 ,结果 为 

n! 


gu) = {DI IT 
0, 其 他 v. 


(1.27) 


全 人 _ 已) wt 0 二 v1 


(三 ) Xe 二 和 五 分 布 
能 算出 抽样 分 布 的 确切 而 简单 的 表达 式 的 情况 , 为 数 不 多 . 所 
率 的 是 , 有 一 个 重要 情况 , 即 总 体 分 布 为 正 态 时 , 许多 重要 统计 量 
的 抽样 分 布 已 经 得 出 ， 这 些 多 与 本 段 标 题 中 指明 的 这 三 种 分 布 有 
密切 关系 ， 
11, 入 分 布设 和 …， 环 为 独立 同 分 布 的 随机 变量 ， 且 
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Xiw~N(0 1)， 令 ~ 六 司 。， 则 的 分 布 称 为 具 自 由 度 n 的 加 


分 布 〈 注 意 二 次 型 局 工 的 矩阵 为 由 阶 单位 阵 , 其 秩 为 %， 因 此 ， 


这 里 自由 度 的 意义 就 是 如 例 工 .10 中 所 说 的 ), 记 为 上 一季 
”为 求 € 的 概率 密度 (wm)， 先 计算 P(E<z)， 当 w<0 时 此 概 
率 显然 为 0， 当 w>0 时 , 依 定义 有 


P(E <2) = (2 ) = |- | oxp( 一 二 Sa ) Cd 
五 


此 处 吾 为 球体 {(zu …, mm) :习习 < 只 、 转 换 到 球 坐标 , 有 


P(E< 人 一 全 er/apr-1 gr, 
此 处 6 为 菜 个 与 m 有 关 的 常数 。 为 求 出 on, 利用 lm P(E < 四 = 
1 的 事实 , 由 上 式 得 
l=0, [er dar. 
在 些 式 中 作 恋 数 代 换 "= 一 2 ,再 利用 Gamma 积分 , 易 算 出 6, 一 
2"2/ 丰 (等 )， 以 此 代入 P(E <w) 表 达 式 ,对 % 求 导 , 即 得 的 要 
f(2)= | FT Ca, >0; (4.28) 
当 w<0. 


它 称 为 自由 度 盖 的 入 人 向 客 旗 
下 面 要 证 明 x? 分 布 的 几 条 性 质 ， 它 们 在 统计 上 有 重要 应 用 . 


这 依赖 下面 的 蔬 抽 备 事实 . 
N(@, 0), t=1, .…, n. 油 4 《ai ) 阶 正 交 方 EE 了 ,一 


2 %=l1, "”**， 则 Y,, ”3 了 。 独立 ， Yi~N( Db,, 02)， b; = 
= 


| 7 一 
0 一 十 ， "和 


证 由 引 理 假定 ， 知 (Eu …， 玉 ,) 的 联合 密度 为 
(2mo”) -oxp (一 可 这 (z4 一 1) 四 . 因 4 为 正 交 阵 , 变 换 的 Jaoobi 
行列 式 绝对 值 为 1 又 由 和 4 的 正 交 性 有 高 (y-5)* 一 高 (m- 
m)*， 于 是 由 多 维 密度 变换 公式 得 (71,…, 了 。) 有 概率 密度 
(2mo”) "sexp( 一 如 5 就 (一 5)?)， 这 就 证 明了 引 理 的 全 部 论 
断 . 


现 往 下 证 明 

定理 1.1 若 于 3， ""*) .~N(g, 0o?), 互 和 8 分 别 是 样本 
均值 和 样本 方差 ( 见 例 1.9, 1.10). 风 1. 豆 ~W(a 02/n); 2. (% 
一 1)83/g?~ 燥 43 38. 耿 与 5 独立. 

证 取 正 交 阵 4 (% 阶 ), 合 其 第 一 行 (ca …, on) 为 (二 =， 
…， 一 )、 作 变换 了 一 AX,， 了 一 (Fs …, 了 了) ,于 一 CX, 
及 则 依 引 理 I.1, 了 Pi,…, 了, 独立，Y ~N(Db:, 0o?3), b= 
4 六 on. 有 如 一 Vw a， 由 和 4 为 正 交 阵 知 襄 ow 一 0 当 6>2, 故 及 
一 0 当 >2， 又 由 正 交 性 有 

(m1)89 一 裕 (ZX 一 于 )" 一 总 ?nT 


-P77 HY?. 

这 里 已 用 了 了 玉 = 了 /Mn、 因 而 叉 ~N(w, o3/w) (这 已 在 例 1.12 
中 证 过 )， 因 为 了 s/o, …, 了 wye 为 服从 入 (0, 1) 的 独立 同 分 布 变 
量 , 由 2 分布 的 定义 知 (wn 一 1)S3/o?~x2?_1， 最 后 , 由 于 总 只 依赖 
了 1, AS? 具 依 赖 ( 了 了 s,…， 了。), 而 了 1,…, 了 全体 独 立 , 知 肝 与 5 
独立 。 定 理 证 毕 . 

本 定理 对 正 态 分 布 参数 的 统计 推断 有 重大 意义 . 

定理 1.2 (Cochran 定理 ) 设 妃 一 ( 忆 :，…， 妃 1 ， 宗 1，。。， 


1 本 省 中 以 不 加 ”的 向 量 为 列 向 量 , 加 % ”表示 转 置 。 
。36 。 


三 相互 独立 ， 人 ,~N(m, C2)， “一 i, oe 各 又 设 Ai, ». ;A 都 
全国 生生 7 十 … 十 Am 一 TT 为 n 阶 单位 阵 ). A 
及 和 4 证 ,一 1 ，…,. mm, 则 当 
Spa a (rk(41) 为 4; 的 秩 ) (1.29) 


时 ， &1， ”3 Em 相互 独立 . 若 记 = (aa， *"*, an )， 则 当 (1,29) 成 立 
县 wdia=0 时 ， Ea/G2 2, 1 一 人 下 (4 ) . 

证 记 =rh( ds). 因 4; 为 秩 m4 的 非 负 定 mw 阶 方 阵 ， 由 甜 
阵 论 知 存在 %Xm 和 矩 阵 B,， 使 4, 一 如 如 . 记 B= (BB, : : Ba : 四 : 
Bm)， 则 B 为 m 阶 方 阵 。 作 变换 了 =( 卫 ,…, 了 ,) 一 BX， 则 因 
4, 有 

YY XBBT- 及 /六 BBI 下 一 阅 丰 /4 下 一 下 (三 ， 

由 此 知 B 为 正 交 阵 ， 故 按 定 理 1.1， 知 六 …', 了 ,独立 ,了 一 
人 (DB c3) 5 一 1 ,nb=(0,…, 5,)~—B'g)， 注 意 到 

B= 一 (了 十 … 二 ni 二 II "yy 玉 + ) 了 一 十 ， *"*y m(no=—0), 
知 如 一 二 1 光一 =1, "WN, 于 是 由 Yi, “ey Y, 相互 独 
立 ,推出 三 ,…, Em 相互 独立 . 

又 车 oAi4 一 0, 则 w.B1Big 一 0， 因 而 Bia=0, 即 D4 一 … 一 0。， 
一 0， 于 是 各/o* 一 名 (74/0) ”其 中 了 /0，…， 了 w/o 相互 独立 ， 
各 有 正 态 分 布 W(0, 二 这 证 明了 B13/ 0 ~ rm. 和 定理 证 毕 . 

此 定理 在 本 书 第 六 .七 章 中 有 重要 应 用 ， 作 为 推论 ,有 下 面 的 


结果 : 
系 1.1 误 81, ,Em ém 相互 独立 ,人 ~xn, 一 2 则 二 一 


> ep 
这 当然 也 不 难 直 接 由 定义 证 明 . 
分布” 设 随机 变量 及 .了 独立 ,总 ~ 六 (0, 1), 了 ~x2. 令 


E 玉 /二 了 . 则 的 分 布 称 为 具 自由 度 久 的 分 布 (这 里 ， 


.37 。 


的 自由 度 取 为 了 的 自由 度 ), 记 为 Et 
由 了 的 密度 为 (1.28), 易 得 出 VY/ 寺 了 的 密度 为 加 (2) ~ 
2 AC (3))(3 2>0). 于 是 的 分 子 分 母 独立 ， 


且 密 度 分 别 为 有 (2) 一 一 上 -oa 和 ha(w)， 依 只 率 论 中 部 知 的 


A/ 2 
关于 商 的 密度 的 公式 
go 一 上 th (ot) holt) dt ， (1.80) 
和 % 十 了 
. ”| 一 一 一 引 、__ 4 二 工 
0 ) (H+) “，-co<o<eco 
Vaw (号) 
: (1.31) 
1 


这 个 密度 函数 的 图 形 与 标准 正 态 分 布 密度 函数 J 62 
的 图 形 相似 ， 都 是 关于 0 对 称 ， 并 当 |z| 一 ce 时 单调 下 降 地 趋 于 
0 在 数学 上 可 以 严格 证 明 : 当 自 由 度 nr~>co 时 , 自由 度 为 % 的 t 
分 布 收敛 于 标准 正 态 分 布 N(0, 1). 

3. 也 分布 设 随机 变量 革 了 独 立 , ~xm, 了 ~xr， 令 = 


工 x /i 六 ， 则 的 分 布 称 为 具 自 由 度 fw 和 的 记分 布 (注意 


分 子 的 自由 度 在 前 ), 记 为 ~ 了 m,n. 

由 此 定义 立 见 : 车 8~ 声 , 则 全 ~ 天 1 

Fw 的 概率 密度 函数 不 难 算 出 。 因为 由 (4.28) 知 互 , 了 的 
密度 ,， 故 习 / 和 和 工交 密度 容易 算出 ， 再 由 分 子 分 母 独立 ， 按 
公式 (1.99), 好 算出 密度 函数 为 


(2 ) 


把 -了 Amtn) 
m/sm/2pi n+ me) 2 ,o>0; 


| 
M0 Tm/ TT 
0, zx<0. 
(1.82) 


3938。 


A 
LA 


”4. 非 中 心 的 办 + 和 万 分 布 设 且 ,…, 也 独立 ， Xi~ 

Neo DD), i 一 1 …, mn、 令 一 避 X?5 一 (如 四 )3， 则 的 分 

布 称 为 具 自由 度 % 和 非 中 心 参数 8 的 非 中 心 X2 分 布 , 记 为 
E ~ Xan, | 时 

设 因 了 独立 , ~W(8, ,了 ~ 民 令 6 三 [AN/ 寺 了 则 

的 分 布 称 为 具 自 由 度 rw 和 非 中 心 参数 5 的 非 中 心 分 布 , 记 为 

CE ~t,, 6. 

设 全 ,了 独立， X~ 雹 4s， 了 ~ 大 令 E 寺 时 /二 了 了， 则 二 

的 分 布 称 为 具 自 由 度 tn, ns 和 非 中 心 参数 8 的 非 中 心 分 布 , 记 ， 

为 ， 


， 人 E~ Fn,n,s, 
、…“ 可 以 看 出 ,前 面 讲 过 的 x*、 和 万 分 布 , 是 此 处 当 非 中 心 参数 
、6 一 0 时 的 特例 ， 因 此 称 为 中 心 的 x*、t 和 了 分 布 .在 只 提 到 这 些 


分 布 的 名 称 而 未 指明 系 中 心 或 非 中 心 时 ， 一 般 了 解 为 中 心 的 . 非 
中 心 x”、t 和 也 分 布 在 统计 上 也 有 重要 意义 ， 不 过 就 本 书 涉及 的 
范围 内 基本 上 用 不 着 它们 , 故 不 作 仔 细 讨 论 了 。 有 些 简 单 性 质 留 
作 习 题 . 


(四 ) 统计 量 的 极限 分 布 ， 大 样本 与 小 样本 
当 样 本 大 小 趋 于 无 穷 时 , 若 统计 量 的 分 布 趋 于 一 定 的 分 布 , 则 
后 者 称 为 该 统计 量 的 极限 分 布 或 渐 近 分 布 ,也 常 称 为 大 样本 分 布 . 
这 可 以 理解 为 : 当 样 本 大 小 很 大 时 ,统计 量 的 近似 分 布 . 
统计 量 的 极限 分 布 , 或 者 更 广 一 些 , 有 关 当 样本 大 小 趋 于 无 穷 
时 统计 量 的 极限 性 质 的 研究 , 其 意义 有 两 个 方面 佛 先 , 如 前 面 指 
出 的 , 要 和 弄 清楚 一 统计 推断 方法 的 优良 人 性 如 何 , 甚至 单纯 为 了 实施 
这 个 推断 方法 , 往往 有 必要 知道 统计 量 的 分 布 。 但 后 者 一 般 很 难 
求 出 , 建立 其 极限 分 布 , 就 提供 了 一 种 近似 解法 的 可 能 性 OD 其 次 ， 
统计 推断 方法 的 某 些 优良 性 准则 ， 本 身 就 是 建立 在 样本 大 小 趋 于 
» 39。 


无 穷 的 基础 上 
当 样 本 大 小 趋 于 无 穷 时 ， 一 个 统计 量 或 者 统计 推断 方法 的 性 
质 ， 称 为 大 桩 本 性 质 . 大 样本 性 质 只 有 在 祥 本 大 小 趋 于 无 穷 时 才 
有 意义 .与 此 相对 , 统计 量 或 者 统计 推断 方法 的 某 一 性 质 , 如 果 在 
样本 大 小 固定 时 有 意义 ,就 称 为 小 样本 性 质 ， 在 此 要 强调 的 是 , 大 
样本 和 小 样本 的 差别 不 在 于 样本 个 数 的 多 少 ,而 在 于 ; 问题 是 在 样 
本 大小 nm~>oco 时 去 讨论 , 还 是 n eke 在 下 nl 
的 部 分 ， 叫 大 样本 统计 理论 ， 近 风 十 年 来 得 到 很 大 的 发 展 ,成 为 
后 数理 统计 发 展 的 特点 之 一 ， 有 些 统计 分 支 , 例如 非 参 数 统计 , 其 
中 大 样本 理论 占据 了 主导 的 地 位 . 
大 样本 理论 将 在 本 书 多 处 地 方 涉及 ， 这 里 只 举 两 个 关于 极限 
分 布 的 例子 . 
例 1.16 设 年 、…、 了 ~ 了 ,了 有 均值 az 和 方差 o8, 设 0 


< cc 一 ceo， 以 下 , 记 样 本 均值 宇和 jn. 按 Lindeberg 中 心 极限 


定理 ,有 
Vn (For ar NO0, 1). (1.88) 


这 里 一 > 表示 依 分 布 收敛 。(1.38) 刻 划 了 统计 量 于 ,的 极限 分 
布 的 形态 ， 这 里 要 注意 的 是 : W(0, 1) 并 非 也 的 分 布 的 极限 、 而 
是 于 ,经 过 “规则 化 ”后 的 极限 分 布 ， 规 则 化 所 用 常数 (ap, cr) 也 
可 以 是 未 知 的 ， 通 常 对 “统计 量 的 极限 分 布 ”一 语 都 是 作 如 此 的 理 
解 。 事 实 上 , 由 于 统计 量 的 分 布依 赖 于 未 知 参 数 , 规则 化 所 用 常数 
自然 会 与 这 些 参数 有 关系 . 

(1.88) 刻 划 了 县, 的 一 个 大 样本 性 质 一 渐 近 正 态 性 ， 它 有 
其 实际 意义 ， 例 如 , 前 面 曾 提 到 ， 若 以 及 作为 总 体 均值 ur 的 估 
计 , 则 互 , 与 ar 的 偏差 超过 某 数 e 的 概率 ， 即 PC(| ,一 az|>>c)， 
可 作为 衡量 这 估计 的 优良 性 的 一 项 指标 ， 落 总 体 分 布 盏 为 正 态 
或 其 他 简单 分 布 ,这 概率 值 可 确切 地 算出 来 ， 但 若 万 较 复 杂 , 其 
至 根本 不 知道 其 类 型 ( 非 参数 情况 ) 时 ， 这 概率 无 法 计算 。 有 了 


"40， 


(1.83), 至 少 在 样本 大 小 n% 较 大 时 ,可 用 正 态 分 布 得 出 这 概率 的 近 
似 值 . 
作为 sr 的 估计 , 反 。 还 有 其 他 一 些 性 质 。 例 如 , 依 Kolmogo- 
rov 强大 数 律 ,有 
PUim 太一 wr) 一 1 (或 写 为 了, -> ar a.g) (1.384) 


即 可 以 用 概率 工 断 言 : 当 样 本 大 小 %n 一 cc 时 , 估计 值 了 ,将 任意 地 
接近 被 估计 值 cr， 这 个 性 质 称 为 全 .的 强 相合 性 . 它 是 一 个 大 样 
本 性 质 ,因为 具有 在 %->oc 时 这 个 性 质 才 有 意义 ， 
勇 一 方面 ,我们 有 
EX,=ar. (1.85) 


就 是 说 , 估计 量 了 ,的 期 望 值 ,等 于 要 估计 的 未 知 量 ar。 这 个 性 质 
称 为 苹 , 的 无 偏 性 ( 蔷 。 是 az 的 无 偏 估计 )。 这 是 一 个 小 样本 性 
质 ,因为 这 个 性 质 的 意义 , 即 (1.35), 是 在 样本 大 小 ”固定 时 去 理 
解 的 . 

例 1.17 设 信 ，…， XX。~f, 于 为 总 体 分 布 密度 。 以 到 oo 记 
其 次 序 统计 量 ( 例 1.15). 设 当 样 本 大 小 m->o0 时 ,m 随 以 一 定 
方式 变化 ,要求 芷 om 的 极限 分 布 。 我 们 来 证 明 下 面 的 定理 . 

定理 1.3 设 0<p<1, lim (mnp)/Mn ~0, 如 满足 


| f(z)dw~p, 且 假定 了 在 各 点 连续 非 0( 由 此 知名 为 的 叭 一 
的 2 分 位 数 )， 则 当 六 一 > CO 时 ， 
Mn f Ep) (Kom— Er) /VP 1—p) > NO0, 1). 
和 (1.36) 


An 证 我 们 前 已 求 出 和 mw 的 密度 函数 fm(z) ( 见 (1.25) 式 ), 由 
此 得 到 (1.36) 式 左 端 的 密度 函数 gm(z)。 不 难 验证 , gm(z) 可 表 为 
Jm(T) 二 A143 的 形式 , 其 中 


4 一 ADg Nm (® je [i— F(A)" ry 


As= f(t)/f (és), 
ee 


其 中 91 2 1 各 如 -全 T、 由 了 在 与 点 连续 且 人 Er) 


>0, 知 lim TD/TCD -1 又 因 人 2] PC PT" 


二 项 分 布 概率 ， 由 概率 论 中 的 局 部 极限 定理 ( 见 复 旦 编 《 概 率 论 > 
p. 214), 知 车 能 证 明 
lim(m— nF(t))/ Vnpg 一 一 zz， (1.87) 


则 有 bn 4 一 -地 一 。"”， 这 将 证 明 lim gale) = -0 因 


而 证 明了 定理 14.8。 为 证 (4.37) 式 , 只 须 把 了 在 如 点 处 作 Taylex 
展开 , 得 (注意 了 (8&5) 一 2) 


FO) =p+4 V 2 sto(-5). 
o(- 产 ) 的 意义 是 tim Vo( 大 )=0 有 


m—nF(t) 多 
A "(Fi 


于 是 由 假定 lm (m 一 np)/W 豆 一 0 得 (1.37)、 定 理 证 毕 。 


不 难看 出 ; 当 m= [(n-+14)wp] 时 , 定理 中 关于 m 的 条 件 适 合 ， 
因此 ,车 在 (1.36) 式 中 将 和 oo 改 为 样本 wp 分 位 数 ( 见 例 .11)， 则 
(1.86) 仍 成 立 . 

把 了:,，…, 蔗 , 的 样本 中 位 数 记 为 piva ((tL.19) 式 )， 由 定理 
1.3 不 难 证 明 ( 习 题 4) 


2 VRf Ea) ma én) -一 > N(0, 1). (1.88) 
定理 1.3 的 证 法 也 可 用 于 讨论 儿 个 次 序 统计 量 的 联合 极限 分 
布 药 问题， 我们 在 此 不 涉及 细节 , 只 提出 下 面 的 结果 ， 
定理 1.4 设 0<p<p<1, ,人 心 f) 以 多 和 2&p 记 了 
的 p 和 wp 分 位 数 , 设 有 (Ep)>>0, (Ep)>0, 且 在 &p.&p 这 两 点 处 
都 连续 ， 以 mp 和 mp 记 玉 ，…'， 六 的 样本 pp 和 Dp 分 位 数 ， 则 当 
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_ 2, mL)' Pp (1—p) 
Am (my én Eg oo) x (0, 0， (CE 3 


pl —D) pl —p) 1.89 

pes, YH) (1.89) 
此 处 入 (0, 0, o3, o3, p) 表示 一 个 二 维 正 态 分 布 ， 其 两 分 量 的 均 
值 都 为 90, 方差 分 别 为 of 和 c2 而 两 分 量 的 相关 系数 为 p。 


(五 ) 充分 统计 量 


统计 量 的 充分 注 是 数理 统计 学 的 一 个 重要 的 基本 概念 . 它 是 - 


了 及. A. Fisher 在 其 1922 年 疯 基 性 工作 (8 1.4 (二 ) 中 所 引 的 ) 中 正 
式 提 出 来 的 . 但 这 个 重要 概念 , Fisher 早 在 1920 年 以 前 的 几 年 里 
就 开始 形成 了 , 当时 他 与 天 文学 家 Eddington 争论 这 样 一 个 问题 ; 
设 i,，…， Xn~vN(g, ao， 要 估计 反映 测量 精度 的 c。 当时 较 常 
用 的 信 计 有 两 个 ; 一 是 样本 方差 ?的 平方 根 8， 一 是 绝对 平均 偶 
差 、 ) 


WN da 到 二 妆 | 马 - 豆 | (1.40) 


(常数 /到 选择 的 理由 是 使 < 为 = 的 无 全 估计 ,参看 例 1.16 末 尼 
处 )，Fisher 竺 成 3 而 Edqdington 丢 成 Hisher 在 1930 年 一 
篇 文章 中 谈 了 他 的 理由 , 其 中 一 点 是 “8 包含 了 样本 中 有 关 o 的 全 
部 信息 ,而 dg 则 否 ”， 正 是 在 这 一 提 法 中 包含 了 统计 量 的 充分 性 这 
个 概念 . 

在 本 节 ( 一 ) 中 已 指出 ; 统计 量 的 一 个 作用 , 是 把 样本 中 有 用 的 
信息 集中 起 来 ， 一 个 统计 量 能 集中 样本 里 的 多 少 信息 , 自 与 统计 
量 的 具体 形式 有 关 ， 但 也 依赖 于 问题 的 统计 模型 (参看 剑 1.25 中 
的 说 明 )， 最 好 的 情况 是 : 统计 量 把 样本 中 的 全 部 信息 都 包含 进来 
了 了 ， 菊 名 话说 , 只 要 算出 了 这 个 统计 量 的 值 ,就 是 把 原始 样本 丢掉 
了 , 也 无 任何 损失 .满足 这 种 条 件 的 统计 量 就 叫做 充 彼 纺 计量 . 涡 
在 我 们 来 设法 给 这 个 直观 论述 以 严格 的 数学 解释 ， 从 而 引出 充分 
统计 量 的 正式 定义 。 
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记 样 本 (XH, …， 王 ) 为 及 设 有 统计 量 了 一 了 了 (对)。 我 们 可 
以 把 得 出 样本 总 的 过 程 看 成 是 由 两 步 实 现 的 : 第 一 步 观察 工 ， 第 
二 步 在 已 知 了 的 条 件 下 去 观察 习 ， 整 个 样本 王 中 所 例 的 《有 关 
马 的 样本 分 布 的 参数 0 的 ) 信 息 , 是 这 两 步 所 提供 的 信息 的 和 ， 第 
一 步 的 信息 就 是 统计 量 了 所 包含 的 信息 。 因 此, 当 且 仅 当 第 二 步 
所 提供 的 信息 为 0 时 , 统计 量 才 是 充分 的 . 但 第 二 步 所 提供 的 信息 
是 否 为 0, 又 取决 于 在 已 知人 的 条 件 下 ,下 的 条 件 分 布 是 否 与 参数 
9 无关. 因为， 倘若 这 条 他 分布 与 9 无关， 则 在 已 知 了 时 进一步 
去 观察 了 ， 相 当 于 去 观察 一 个 与 9 毫 无 关系 的 量 ， 其 中 当然 不 包 
含 关 于 8 的 信息 ， 反 之 ， 若 这 条 件 分 布 与 8 有关， 则 在 已 知 了 时 
观察 卫 , 还 可 以 提供 一 些 关 于 8 的 信息 .这 样 ,可 以 给 出 充分 统计 
量 的 正式 定义 如 下 . 

定义 1.1 设 样本 茸 的 分 布 族 为 {Fo(%w): 9E€ @}, 8 为 分 布 的 
参数 ， 设 工 = 工 (X ) 为 一 统计 量 . 若 在 已 知 了 的 条 件 下 ， 王 的 条 
件 分 布 与 86 无关, 则 称 了 是 充分 统计 量 . 

在 大 多 数 情况 下 , 样本 空间 和 是 尽 " 的 一 部 分 , 而 统计 量 和 可 
表 为 了 一 人 2 9 了 DD)，T1,…, Tw 都 是 一 维 变量 ,6 一般 是 很 小 
的 自然 数 ， 并 可 以 找到 另 一 统计 量 W= (WW,, 3 Wy), 使 得 变 
换 

KTR), 7, ToT), WX), 1, Wan()) (1.41) 
是 一 个 一 一 对 应 的 变换 。 这 时 ,在 已 知 了 T 了 (了 于) 一 ( 妇 ,…, 如 ) (这 等 
于 把 芋 限制 在 集合 {了 :了 (了 对) 一 ( 厂 ,…, 机 )} 一 B 内 ) 的 条 件 下 , 子 
与 玉 有 一 一 对 应 关系 (确切 地 说 , 当 于 局 限于 B 内 时 有 一 一 对 应 
关系 ), 因 此 ,要 确定 在 给 定 了 时 于 的 条 件 分 布 是 否 与 9 有关， 只 
须 确定 在 给 定 了 时 ,WW 的 条 件 分 布 是 否 与 9 有 关 . 这 一 事实 将 用 
于 证 明定 盏 工 .5. 

下 面 考察 几 个 例子 。 

例 1.18 设 玉 ,有 ~N(0,1), 一 0<b<o0, 丰 一 对 一 
壤 寥 忆 。 作 正 交 变换 了 一己- 郊 - V 王 站 =-V 克 Ti 一 


和 


AN、 
~ 


Dou, (参看 引 理 1.1 的 证 明 )， 此 处 了 1 实质 上 就 是 了 TT, 而 Ys， 


… ,了 ,起 着 矿 1, We,… 的 作用 。 依 引 理 I.1, 知 Fi, Ya, *…, YY, 
独立 , 故 给 定 卫 《和 即 给 定 人 了) 时 ，( 了 s,…, 了 ,) 的 条 件 分 布 ， 就 是 
(Ys,…, 了 了 ,) 的 无 条 件 分 布 ,但 依 定理 1.1， 了 s, …, 了 ， 独立 同 分 
布 , 且 各 有 分 布 让 (0, 1)， 即 (Ys, …, 了 ,) 的 分 布 与 0 无 关 。 因 
此 证 明了 互 是 充分 统计 量 ， 

例 1.19 回 到 例 1.1 和 1.23， 设 其 中 六 已 知 而 ML 为 未 知 参 


数 ， 则 易 见 : 不 论 是 例 工 .1 无 放 回 的 情况 , 还 是 例 荆 .2 有 放 回 的 情 
况 , 都 有 
PRI=0, 0, R= mT = PRL= 0 0， 马 一 0 
T=a)/P(T=0)=P(Ri=%, *…, X=%,)/P(T=a) 


(5) 
当 wa， …，zmr 都 为 0 或 二 且 zi 十 … 十 mm 一 4( 否 则 上 述 条 件 概率 为 
0), 在 计算 中 用 到 了 (4.1)、(1.2)、(1.22) 和 (1.23) 式 .由 于 这 条 
件 概率 与 参数 到 无 关 , 证 明了 统计 量 7 是 充分 的 . 
例 14.20 回 到 例 1.18， 考 虑 统计 量 了 T= 于 ， 这 时 ， 可 以 取 
Wi 到 ，,,，… 为 耻 s,…, 耳 。, 在 给 定 了 了 即 他 1 的 条 件 下 , (了 an) 


的 条 件 分 布 即 其 无 条 件 分 布 ， 它 的 概率 密度 站 (a ce 


与 86 有关, 因此 依 定 义 1.1, 下 = 闷 ; 不 是 充分 统计 量 . 

例 1.19 和 1.20 的 结果 在 直观 上 是 可 以 预料 的 ， 在 例 1.19 
中 , 车 已 知 样本 中 的 总 废品 数 ， 则 进一步 知道 “这 些 废品 是 在 那 几 
次 抽 得 的 ”, 对 推断 整 批 废品 数 M 看 来 并 无 帮助 ， 对 例 工 .20 则 更 
明显 ， 统 计量 正中 只 使 用 了 一 个 观测 值 闷 ,， 把 其 余 观 测 值 Xs， 
-…， 莹 ,全 委 了 , 它 当 然 不 能 把 样本 卫 ,…, 成 , 中 的 所 有 信息 都 集 
中 起 来 、 例 1.18 的 结果 则 不 能 说 在 直观 上 很 明显 ， 事实 上 , 并 非 
在 任何 情况 下 ， 样 本 均值 都 能 包含 有 关 总 体 均值 的 全 部 信息 .这 
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一 点 取决 于 总 体 分 布 的 形式 (习题 7). 

直接 用 定义 1.1 去 验证 一 个 统计 量 的 充分 性 , 往往 要 经 过 
复杂 的 计算 ， 幸好, 有 下 面 的 一 般 性 判定 法 , 它 在 应 用 上 很 方便 . 

定理 工 .5 (因子 分 解 定理 ) 设 样 本 下 一 (也, …, 耶 ,) 的 概率 
函数 fo(w1,，…, om%) 依 赖 于 参数 9, TT( 卫 ) 是 一 个 统计 量 ， 则 
了 为 充分 统计 量 的 充 要 条 件 是 : foCw1,，…, zw) 可 以 分 解 为 

(ci ge(T Ts se an) hm, “Wn) (1.42) 
的 形状 、 注 意 函 数 有 不依 赖 于 参数 0. 

这 里 概率 函数 的 意义 是 ; 若 卫 是 连续 型 的 ， 则 所 C21 …， 0) 
是 其 概率 密度 ， 若 全 是 离散 型 的 ， 则 fo(zwi, …, 2%,) 一 了 Ps( 六 1 一 
vi， …， 闷 一 如 )， 卫 , 表示: 有关 概率 是 在 参数 值 为 D 时 计算 的 . 

这 个 重要 的 定理 在 二 十 年 代 就 由 R. A. Fisher 提出 来 , 它 的 
最 一 般 形式 和 严格 数学 证 明 ， 是 Halmos 和 Savage 在 1949 年 作 
出 的 . 

为 确定 计 , 考 虑 下 有 概率 密度 的 情况 ， 并 补充 假定 了 有 (Ti 
…， 了 Ds) 的 形式 , 且 可 以 补充 统计 量 太一 ( 玉 1，…, 到 ,_p), 适合 定 
义 1.1 下 面 那 一 段 话 的 条 件 。 以 J 了 记 变 换 (1.4) 的 Jaoobi 行列 
式 的 绝对 信 , 并 将 四 ,mm 的 函数 有 (vw1,…, zw)/J 表 为 T,W 的 
函数 五 (了, 玉 ), 则 由 概率 密度 变换 公式 及 (i.42)， 知 (T, 邢 ) 的 
密度 为 gos(T) 五 (T, WW). 于 是 得 到 ; 在 给 定 了 时 ，W 的 条 件 密度 
为 


gDIHT, W) /| gH, Wa 


En 
~H(T, W) / |,. HOT, Waw. 


此 条 件 密度 与 9 无关 ， 故 工 为 充分 统计 量 ， 这 证 明了 条 件 (1.42) 
的 充分 性 ， 

反之 , 设 了 了 为 充分 统计 量 , 则 以 G(T, 栈 ) 记 给 定 正 时, 琴 的 
条 件 密 度 ， 由 充分， 知 G 与 9 无 关 ， 故 得 (了 T, 仇 ) 的 联合 密度 
为 gs(T)GCT, 到 ), 其 中 go《T) 为 了 的 密度 函数 .把 GLT, 到 ) 表 
se 40 。 


为 风 各 的 函数 加 (zz; …， 加)， 则 仍 由 密度 变换 公式 得 (Xi 
…， ,的 密度 为 goeCT (V1, 7 Vn)) hwy, vn) gelD Cw, """) 
wn) 有 hv， 0n), 其 中 妨 (g1 po) 一 本 (0 oo) 了 与 8 无 
关 . 这 证 明了 条 件 (1.41) 的 必要 性 ,定理 证 毕 . 

利用 这 个 定理 很 容易 判定 许多 重要 的 统计 量 的 充分 性 (或 不 
充分 性 ), 如 例 1.18 和 1.19. 

例 1.21 设 耶 ,…，, na ac 人 参数 为 0=(a, o). 以 
z 和 S23 分 别 记 样本 均值 和 样本 方差 , 则 (总 ， 83) 是 充分 统计 量 . 

事实 上 , (了 1,…， 了,) 有 概率 密度 

(V2 0) exp( — 1 > 0) ) 
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因而 有 (1.42) 的 形式 ( 取 其 中 的 =1). 
例 1.22 设 1， “*°, Zn ~ NG, CO” )， 了 3 ”3 Ya»~N(b, 
0”), 且 两 组 样本 独立 . 记 耻 一 加 了 /m, 了 一 加 了/m, 而 
So [+7)]. (1.48) 
则 与 上 例 类 似 证 明 ; (于 , 了，S?) 为 充分 统计 量 .、 注意 此 例 中 两 总 
体 方差 相同 , 而 模型 中 的 参数 是 9~ (a, 5, 0”). 
例 工 .如 回 到 例 1.5, 参数 为 X 用 条 件 (1.42) 立 即 得 到 . 子 
是 充分 统计 量 ， 
例 1 .24 设 六 1， ”3 ,~R(0, 0), 0>0. 这 里 RCO, 0) 记 
区 间 (0, 0) 上 的 均匀 分 布 , 记 
T=~max(F, .…, £,). (1.44) 
(ZX, “3 三) 的 联 会 密度 为 
全 当 max (1, ”5 Tn) 一 全 
0 ,其 他 情况 . 
在 本 例 中 ， 祥 本 只 能 取 正 值 , 故 户 (z，…，m) 只 须 在 集合 { (wi 
0 470 


Jo(zo “7, tn) = 


(1.45) 


0 0 人 >0, 5 一 二 … nn} 一 BB 上 定义 . (1.4) 式 也 是 在 集 B 上 

而 言 易 见 , 若 定义 函数 gel 站 一 1 当 0<t<9, 在 其 他 处 为 0, 而 8 

大 1，, 则 红 . 全 ) 可 改写 为 fo (wi， “wD wn) = go th (vw, “°° vm,)。 因 此 
由 (1.44) 定 义 的 统计 量 人 了 是 充分 的 . 


例 1.25 设 Zz,…, ,~BR(- 汪 + 二 +0), _o0<0< 
co 6 是 区 间 [一 吝 二 9， 去 +9| 的 中 点 ， 也 就 是 总 体 分 布 的 期 望 


值 . 用 定理 工 .5 不 难 验证 , 样本 均值 苹 并 不 是 充分 统计 量 ( 污 者 
自 证 ). 

。 例 1.18 与 例 1.25 结合 ,说 明了 前 面 提 到 过 的 一 件 事实 : 一 个 
统计 量 是 否 为 充分 ,不 仅 取决 于 这 统计 量 的 形式 , 也 与 问题 的 模型 
即 样 本 分 布 族 有 关 . 


习 是 


1， 一 个 总 体 有 X 个 元 素 ， 其 指标 值 分 别 为 d> aa>…>awr。 指定 自 
然 数 用 <N, n< 入 ， 并 设 m=%M/N 为 整数 .在 (ad …，wao 中 不 放 回 地 随 
机 抽出 mw 个 ,在 (axsl …，ax) 中 不 放 回 地 随机 抽出 ”一 个 。 写 出 所 得 样 
本 的 分 布 . 

2. 一 物体 的 重量 as 未 知 ， 有 两 架 天 平 可 用 ， 其 随机 误差 分 别 服从 正 态 
分 布 W(0, oD, NC0, oD), o? 和 昌都 未 知 。 先 把 该 物件 在 第 一 架 天 平 上 秤 
两 次 得 和 Xi， 及 ，， 再 在 第 二 架 天 平 上 秤 两 次 得 了 3， 及， 然后 视 | XX1 一 Xa| < 
| 一 X,| 或 否 而 在 第 一 架 或 第 二 架 天 平 上 再 秤 9 一 4 次 得 和 pb， …， 瑟 a。 写 
出 (1，…， 及 的 密度 . 

3. 完成 (1.20) 式 的 归纳 证 明 ， 

4. 利用 定理 1.3 证 明 (1.38) 式 . 要 把 % 取 奇 数 和 ” 取 偶 数 的 情况 分 开 
处 理 ( 提 示 : 先 证 明 : 若 Xs。< 了 。 志 2 而 当 9-> oo 时 , 了 的 分 布 和 Gu 的 分 布 
收敛 于 同一 极限 , 则 了 ， 的 分 布 也 收敛 于 该 极限 ). 

5. 设 T=T( 叉 ) 是 充分 统计 量 , 又 S(X) 一 G(T(X)), 而 函数 8=G(7) 
是 一 对 一 的 ( 即 于 To3GCT4) 天 GCT3)), 则 5 也 是 充分 统计 量 . 

6， 直 接 由 充分 统计 量 的 定义 出 发 证 明 : 车 和 …, 并 是 从 分 布 族 
《1.8) 中 抽出 的 独立 随机 样本 。 直接 由 定义 出 发 ， 证 明 广 是 充分 统计 量 ( 提 


示 : 用 例 1.18 的 方法 , 作 线性 变换 Zi 一 局 X,Y, 一 ,i=2,…, 9) 


* 48» | 


7. 设 全 1 …， KanwN(9, 9)，0>0. 问 立 是 否 仍 为 充分 统计 量 ? 〈 提 
示 : 用 因子 分 解 定理 ) 

3， 证明 PCXw< 功 的 积分 表达 式 (1.24 (提示 :为 证 六 ( jzd- 
的 下 ad-Dr"de 注意 2 0 时 两 边 相等 两边 对 刀 的 导数 
也 一 样 ). : 

9. 仔细 写 出 推导 (1. 26) 的 过 程 (提示 : 先 证 明 


上 “| 。 f (21) -Ff Cor) dr ds = 村 [FF(D) — FO). 


10. 设 E~ 惨 a 为 常数 ， 计 算 Bs” 和 Var(&"). 注意 4 取 那 些 值 时 这 
些 量 才 存在 .又 问 : & 的 密度 的 最 大 值 在 那 一 点 达到 ? 


11. 设 继 如 证 明 当 n>o% 时 (从 /V 枫 -全 N(0, 1). 利用 这 
个 事实 , 给 出 尾 的 p 分 位 点 与 (0, 卫 的 2 分 位 点 之 间 的 一 个 近似 关系 . 

12. 设 &~ 刀 ， 计 算 ' Var(&,)， 注 意 % 取 何 值 时 , Var(é%) 才 存在 ， 

13. 设 X1, ,Xn~N(a, a2). -> X,/n, 8S? =3X,— /Cn 
1). 记 ==(X1 一 3)/5. 找 出 专 与 十 分 布 的 联系 , 因而 定 出 的 密度 (提示 : 作 
正 交 变 换 了 1M 及, 了 ?一 一 2 (XI 一 灭 )， 了 ,= Seuzs j= $, 0, 
n, 利用 定理 1.1)， 

14. 非 中 心 必 变量 = 对 (X40D” Zn nN, Da "on 
为 常数 证 明 ; 的 分 布 只 依赖 于 » 和 6=( 兆 D12 (提示 ， 作 正 交 变 换 , 使 
=X/5). 

15. 设 Xi …， XX 独立, 和 NT(0， o 和 ,5 一 1，…, n, 定 义 6= 忆 (X, 一 
2)?/o%， 其 中 2 一 - 电 瑟 /局 十， 来 二 的 分 布 (提示 : 作 适当 的 正 交 变换 )， 


16. 设 和 ,Xn~N(a, a), 六 为 样本 均值 ，# 一 了 (X1,…， Zn) 满 
足 条 件 (X10 …，n 十 6) 二 有 (XI "…， 芝 nm), 对 任何 常数 ce。 证明: 与 六 
独立 (提示 : 作 定理 1.1 中 的 变换 , 把 表 为 了 1 …， 了 sw 的 函数 , 证 明 此 子 数 
只 依赖 于 了 s,…, 了 a)， 举 出 此 结果 的 一 些 应 用 (样本 方差 , 极 差 )。 
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第 二 章 点 估 计 


这 个 题 月 在 上 一 章 中 已 经 多 次 提 到 过 了 。 设 样本 总 的 分 布 
依赖 于 参数 9, 9 取 值 子 @ 内 , 昌 称 为 参数 空间 . 设 9(0) 是 一 个 定 
义 在 9 上 的 已 知 函 数 . 要 通过 样本 且 去 估计 9(9) 的 值 ， 这 里 46 
和 g(0) 都 可 以 是 一 维 或 者 多 维 ， 一 个 重要 的 特例 是 gC0) 一 0， 或 
9(9) 等 于 0 的 某 个 分 量 . 例如 , 正 态 分 布 W(w， o*) 有 参数 9 一 (a, 
o”), 我 们 上 只 估计 9(9)=w， 在 本 书 所 讨论 的 多 数 情况 下 , 样本 于 
有 (及 1，…， 了 及 ,) 的 形式 ,其 中 有 1, …， 子 ,相互 独立 相同 分 布 , 这 
时 0 是 总 体 分 布 的 参数 ， 而 我 们 可 用 估计 总 体 分 布 的 参数 这 个 提 
法 . 一 般 统 计 著 作 中 多 用 这 个 提 法 . 然而 应 当 注意， 如 在 $1.2 
(四 ) 中 所 指出 的 , 只 有 在 简单 随机 样本 的 情况 下 , “总 体 分 布 ”一 词 
才 有 了 明确 的 意义 ,或 更 确切 地 说 ,才能 由 总 体 分 布 决定 样本 分 布 . 
直接 从 样本 分 布 出 发 就 没有 这 种 问题 . 

9(9) 常 称 为 “ 待 估 函 数 ” 或 “被 估计 量 ”。 为 估计 它 , 就 要 决定 
一 个 适当 的 函数 9, 定义 于 样本 空间 多 , 使 得 每 当 有 了 样本 时， 就 
以 8 互 ) 作 为 9(9) 的 估计 值 ，9( 互 ) 是 一 个 统计 量 , 因 其 用 于 作 点 
估计 , 常 称 之 为 估计 量 . 

点 舍 计 是 数理 统计 学 中 内 容 很 夺 富 的 一 个 分 支 。 它 主要 包括 
制定 估计 量 的 一 般 方法 , 制定 有 关 佑 计量 优良 性 的 种 种 合理 准则 ， 
寻求 某 种 特定 准则 下 的 最 优 估 计量 ， 以 及 记 明 某 一 特定 的 估计 量 
(用 直观 方法 或 某 种 一 般 性 方法 得 到 的 ) 在 茶 种 准则 之 下 有 最 优 性 
等 等 。 本 书 有 关 点 估计 的 内 容 , 除 一 部 分 (基础 的 和 一 般 性 的 ) 内 
容 集中 在 本 章 讨 论 外 , 还 在 第 五 ~ 七 章 中 占 一 定 的 地 位 ， 


$2.1 和 矩 估 计 与 极 大 似 然 估计 


(一 ) 算 估 计 方 法 
定义 2.1 设 有 样本 妈 3， ”3 三 有 厅 k 为 自然 数 ， 则 
HO 。 


i 


au -训导 及 mmr 寺 妆 (X 一 并 

分 别称 为 天 阶 样本 原点 矩 和 天 阶 样本 中 心 矩 ,这 里 总. 一 wa 
鹤 Tn 是 拌 本 均值. 

当时 mw 一 0 又 ws 与 样本 方差 6? 只 相差 一 常数 因子 
( 见 (.18) 式 )、 一 般 , 祥 本 中 心算 或 通过 样本 原点 矩 表 出 ; 

mm 一 局 (一 Dava5ir (amw=1). (2.2) 

设 X;，…, 子 , 是 简单 随机 样本 ( 即 卫 ，…,， 及 ,独立 同 分 布 ， 
见 (1.10) 式 前 面 的 说 明 ), 则 有 总 体 分 布 态 ， 这 时 ， 样 本 和 矩 可 用 于 
估计 分 布 瑟 的 相应 阶 的 矩 ( 称 为 总 体 矩 )， 即 著 以 m 和 jp 分别 记 
玉 的 六 阶 原 点 竺 及 不 阶 中 心 矩 ， 则 可 用 am 估计 or， Tns 估计 /只 
这 是 一 种 基于 直观 的 方法 ， 它 的 一 个 依据 是 ; am 是 o 的 无 馆 估 计 
( 见 (1.85) 式 的 说 明 ) 

am 记名 BXY -TD oo. (2.8) 

但 如 用 wen 估计 wo， 则 一 般 不 是 无 偏 的 , 不 过 当 样 本 大 小 % 较 大 


时 ,偏差 不 显著 , 且 必 要 时 可 作 一 些 修正 ,使 之 成 为 无 候 的 . 
例 8.1 jw 是 总 体 分 布 的 方差 ， 车 用 ww 估计 ua, 则 
Bo 一 工 Sx? BY) 
—/at+ (Var(¥,) + (BY.)’) 
=pa to (i pat )~ "一 Ha (2.4) 
基 而 mows 不 是 ja 的 无 偏 估计 ， 且 是 系统 地 僻 侯 ,在 本 例 中 修正 
: 洽 ,只 须 用 
代替 mwa, 就 得 到 加 6? 一 jw， 县 6? 是 总 体 方差 um 的 无 偏 估计 ， 这 
正 是 (1.18) 式 定义 样本 方差 时 , 采用 因 了 于 于 的 原因 0， 当 % 较 


ss Bls。 


大 时 , 二 者 差别 不 大 . 

” 当 %>=4 时 ,就 不 能 通过 这 样 简单 的 修正 , 由 mw 得 出 pow 的 无 
偏 估 计 ， 而 需要 使 用 几 个 中 心 矩 . 一 般 在 应 用 上 风 不 去 作 任 何 修 
正 , 而 容忍 一 些 偏差 存在 ， 如 上 所 述 ,对 较 大 的 m” 这 与 应 用 无 损 。 

现 设 总 体 分 布依 赖 于 参数 68， 而 待 估 函数 g(9) (假定 是 一 维 
的 ) 可 表 为 总 体 分 布 的 若干 个 矩 的 函数 : | 
gO0)= Go, ak， Ha , Ht) (2.5) 
且 有 了 简单 随机 样本 互 l， …， 及 ,。。 则 可 以 用 下 面 的 方法 构造 出 
9(0) 的 一 个 估计 量 ; 用 wu 估计 ow, mm 估计 Mo 然后 令 (并 = (XX 
…， 到。)) . 
9g( 及 ) —G (ni, , np Ming °°, Mond), (2.6) 

即 以 之 作为 g9(9) 的 合计 ,(2.6) 称 为 g(9) 的 一 个 矩 估计 . 需要 注 
意 的 是 ， 同 一 个 g(0) 往 往 可 以 有 几 种 不 同 的 方法 表 为 (2.5) 的 形 
式 . 因此 ， 失 估计 也 可 以 有 许多 . 这样， 我 们 最 好 把 矩 估计 看 成 
构造 估计 量 的 一 种 一 般 性 方法 ， 而 不 看 成 是 一 种 有 固定 程序 的 算 

例 2.3 设 总 体 分 布 为 Poisson 分 布 


Pu( 开 = 四 一 二 6-ege， w—0, 1, 2, .… 0<0<00, (2.7) 


9 为 未 知 参数 (注意 , (2.7) 式 中 的 了 并 非 样 本 ,而 是 总 体 变量 , 见 
(GL.1D 式 下 面 的 说 明 )。 设 下 1,…， 耻 ,为 抽 自 此 总 体 的 简单 随 
机 样本 ,要 估计 g(0) ~0. 

如 所 周知 ,对 Poisson 分 布 (2.7), 参 数 9 既是 其 均值 mi, 又 是 
其 方差 lm。 按 二 者 可 分 别 构造 其 矩 估计 ai 和 us 它们 自然 是 不 
同 的 . 

在 (2.7) 式 中 , 表示 概率 的 记号 也 下 面 加 了 一 个 足 标 9, 它 表 
示 在 计算 概率 时 ,是 从 分 布 中 的 参数 值 为 6 出 发 的 。 以 后 将 要 出 
现 的 记号 加，Van 苏 都 是 这 个 意义 ， 这 二 点 在 统计 中 很 重要 . 因 
为 在 统计 中 , 样本 或 总 体 的 可 能 分 布 不 是 一 个 ,而 是 一 个 族 . 在 计 
算 与 这 种 分 布 有 关 的 量 时 , 明确 指出 其 参数 什 常 是 很 重要 的 ,不 然 


® Ho. 


就 可 能 引起 混淆 . 
下 面 再 举 几 个 例子 说 明 求 惩 估计 的 方法 . 
例 2.3 设 奴 i ”5 .~R(, 0,), 参数 0=(0， 0,), 在 
一 oo<b<p<oo 内 变化 , 求 入 和 扩 的 拭 估 计 . 


易 算出 总 体 分 布 的 均值 为 一 去 (5 二 0 方差 为 -5 (Os— 


081)?”， 分 别 以 仁和 S? 记 样本 均值 和 样本 方差 , 负 和 人 4， 和 0 
的 秆 估计 , 按 矩 估计 法 , ( 久 ， 纪 ) 应 是 方程 组 { 玉 = (0+6,)/2, 8 一 
(6, 一 生 )?/12} 的 解 , 故 得 
b= 于 -VBS, 6=T+ VS. (2.8) 
著 要 估计 9 一,, 即 分 布 区 间 之 长 , 可 用 -~2V 38. 
例 2.4 设 总 体 分 布 有 概率 密度 
fa 0 一 zc 态 ， 05) 
2 . vexp(—w"), 2>0; 
-1 了 (3 (2.9) 
0， <0. 
参数 8= (1, 而 ) 的 变化 范围 为 一 1 过 抽 二 co0，0s>0， 设 及 1， "oy 
下, 为 抽 自 此 总 体 的 简单 随机 样本 , 求 和 的 的 矩 估计 . 
简单 计算 得 到 总 体 分 布 的 前 两 阶 矩 为 : 


ma- 人 对 生 )AT (二 于 ) 


“~T (Ye) Jr (sse) (9.10) . 


按 和 矩 信 计 作法 ,用 cui 和 an 分别 代替 (2.10) 中 的 和 os， 访 和 6 

分 别 代替 和 0。， 即 得 出 一 个 方程 组 ， 其 解 就 是 外，0s 的 一 个 矩 

估计 . 但 此 处 得 不 出 简单 的 解析 表达 式 , 而 只 能 用 数值 方法 . 

例 2.5 以 必 记 总 体 分 布 的 磊 阶 中 心 矩 ,ol 记 其 均值 , 则 
Bi~ wa/ wa’, Ba= Ws/ Wi2, v=— /ay/oa 

分 别称 为 总 体 分 布 的 偏 度 、 峰 度 和 变异 系数 . 当 总 体 分 布 关 于 某 

点 对 称 时 ，B1 一 0。 故 Bi 是 作为 总 体 分 布 的 “ 非 对 称 性 或 偏 倚 
。 53 。， 


性 的 一 种 度量 . 特别 , 当 总 体 分 布 为 正 态 时 , 6B:=0 而 :一 8、 因 
此 ,Ba 与 0 的 差异 及 Bs 与 8 的 差异 , 可 作为 总 体 分 布 与 正 态 的 偏 


离 的 一 种 度量 .变异 系数 % 是 衡量 总 体 分 布 散布 程度 的 一 项 指 - 


标 , 但 是 这 散布 程度 是 以 总 体 均值 为 单位 来 度量 .用 答 估 计 法 , 直 
接 作出 这 些 量 的 估计 . 

另 有 一 类 直接 由 和 矩 定义 的 ,在 较 早 期 统计 文献 中 常 提 到 的 量 ， 
叫 半 不 变量 。 其 定义 如 下 , 设 总 体 分 布 有 直至 阶 为 止 的 原点 短 
cu, …， om 将 其 特征 函数 g( 台 在 t=0 的 附近 表 为 


p(t) =1+ 祈 广 oj( 的 oo 四 ， 
两 边 取 对 数 , 再 作 一 些 简 单 的 代数 整理 , 易 得 
log p(1) -1+ 总 元 (1 十 o( 反 ). (2.11) 


系数 z 就 称 为 总 体 分 布 的 7 阶 半 不 变量 , ww 可 天 过 总 体 的 前 j 阶 
原点 或 中 心 秆 表 出 ,例如 : 

Vi, Ta— Ha, Ta— a, Vas 3 M2, Ts= Ms— 10 wors 

/ (2.12) 

等 等 ， 这 些 基 的 算 估 计 都 可 以 直接 写 出 . 

例 2.6 和 矩 估计 法 也 可 用 于 多 维 样 本 .例如 ， 设 (交工 )， 
和 = 区 为 从 一 个 二 维 总 体 中 抽出 的 简单 随机 样本 ， 总 体 分 布 
的 协 方差 和 相关 系数 ,分 别 用 pa 和 卫 记 , 则 jwr 和 pp 可 分 别 用 


mas 一 二 X,Y, 7)(T- 太 /n, Y ~ YW/n) 
(2.18) 
和 入 中 中 
rT TFT) /HFT 7)) 
(2.14) 
去 估计 ,mu 和 ?7 分 别称 为 样本 协 方差 和 样本 相关 系数 , 详 见 第 七 
章 。 
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(二 ) 极 大 似 然 估计 

定义 2.% 设 祥 本 卫 ( 不 一 定 是 简单 随机 样本 ) 有 概率 函数 
f(%w, 9) (概率 函数 的 意义 ， 兄 侍 .42) 式 下 面 的 说 明 ). 这 里 0 为 参 
数 ,在 参数 空间 B 内 取信 ， 当 固定 2 而 把 f(z, 9) 看 成 是 0 的 定义 
在 @ 上 的 函数 时 , 它 称 为 似 然 函数 . 

所 以 , 概 尝 允 数 与 似 然 函 数 可 以 说 是 一 回 事 , 只 是 看 法 不 同 . 
前 者 是 固定 9 而 看 成 是 4 在 样本 空间 2 上 的 函数 ,后 者 则 固定 % 
而 看 成 是 0 在 日 的 函数 ， 这 个 差别 在 统计 上 的 意义 如 下 ; 不 妨 把 
参数 9 和 样本 v 分 别 看 成 是 “原因 ”和 “结果 ”, 定 了 9 的 值 , 就 完全 
确定 了 样本 分 布 , 也 就 定 下 了 得 到 种 种 结果 (zw) 的 机 会 大 小 .这 是 
从 正面 看 ， 从 反面 看 ,， 当 有 了 结果 (样本 )w 时 ,我 们 问 ， 当 参数 9 
取 各 种 不 同 的 人 (原因 时 , 导出 这 个 结果 (w) 的 可 能 性 有 多 大 ?这 个 
问题 的 回答 引出 似 然 函 数 的 概念 .“ 似 然 " 的 字面 意义 就 是 “看 起 
来 象 ?， 说 仔细 一 些 , 就 是 : 当 我 们 有 了 结果 2 时 , 这 结果 看 来 是 由 
原因 6 而 产生 的 可 能 性 , 与 似 然 函 数 信 fCw, 9) 成 比例 .由 于 统计 
推断 是 由 样本 推断 参数 ， 这 个 看 法 就 可 以 作为 一 种 统计 推 斯 方法 
的 哲理 基础 、 事 实 上 ， 确 有 一 些 统计 学 家 作 这 样 的 主张 ， 它 们 把 
基于 每 个 参数 值 的 “ 似 然 性 ”去 进行 统计 推断 这 个 原则 ， 叫 做 似 然 
原则 。 应 当 注 意 的 是 ,反映 6 的 似 然 性 的 f(%, 9), 虽然 是 源 出 于 
一 个 概率 论 购 念 一 一 概率 函数 ,本 身 并 不 是 通常 意义 下 的 概率 , 它 
自然 也 没有 频率 解释 . 

似 然 原则 的 一 项 重要 应 用 ， 就 是 由 下 述 定义 所 确定 的 极 大 似 
然 估计 . 

定义 2.38 在 定义 2.2 的 记号 下 , 车 6( 卫 ) 是 一 个 统计 量 , 满 
足 条 件 

jw Ow)) —sup fl%, 0), EY. (2.15) 


2 是 样本 空间 , 则 称 6( 且 ) 是 9 的 极 大 似 然 估 计 ， 若 待 舍 沙 数 是 
g(9), 则 称 gCO( 脏 )) 为 极 大 似 然 估计 。 
s Ss 


按 我 们 上 面 对 “ 似 然 性 ”一 词 所 作 的 解释 , 6 的 极 大 似 然 估计 
6(z), 就 是 在 已 得 样本 “的 情况 下 , 似 然 性 最 大 的 那个 6 值 ， 知 道 
z 自然 不 能 唯一 决定 9, 取 那 个 值 去 估计 9 呢 ? 要 取 那 个 “看 起 来 
最 象 ”的 值 ， 如 果 我 们 同意 上 述 关 于 似 然 性 的 直观 解释 , 这 个 选择 
不 仅 合乎 逻辑 , 甚至 可 以 说 是 唯一 合理 的 ， 

6 的 确定 要 解 一 个 极 值 问题 ， 有 时 这 是 很 困难 的 ， 而 不 能 不 
采用 数值 方法 .在 孚 一 ( 节 1,…, 于 ,) 为 简单 随机 样本 而 总 体 分 


布 有 概率 函数 p(w) 时 , 似 然 函 数 为 Jz, 9) 一 开矿 (z0。， 这 时 ， 
f(%, 9) 的 对 数 


log f(z, 0)~Zlogfl%) (2.10) 
在 使 用 上 较 方便 。 log f(z, 0) 称 为 对 数 似 然 函 数 . 自然 , 极 大 似 
然 合计 6(wz) 也 可 以 等 价 地 定义 为 


例 2.7 前面 讨 论 过 的 一 些 例子 中 ,有些 其 极 大 似 然 估计 很 
易 求 得 ， 例 如 , 据 (1.1) 或 (1.2) 式 易 知 , 在 例 1.1 和 例 1.2 之 下 ， 


批 中 废品 数 M 的 极 大 似 然 估计 都 是 二 (下 :十 … 十 下,) 一 了 ， 
或 者 说 , 批 废品 率 -1- 的 极 大 似 然 估 计 , 就 是 所 抽样 本 中 隐 庆 品 
* 闷 . 在 例 1.4 中 ， 关 设 6 已 知 , 则 对 数 似 然 函 数 为 nlog -7 一 一 

如 5 启 (m 一 0)?， 由 此 导出 a 的 极 大 似 然 估计 为 县. 例 1.5 的 
对 数 似 然 函 数 为 ”1og 和 一 ^ wm， 导出 入 的 极 大 似 然 售 计 为 


1/ 苹 .在 这 几 个 例子 中 , 极 大 似 然 佑 计 同 时 也 是 矩 估 计 . 
例 3.8 设 仁 1, …, ,~~N(a, co)， oe 0). 求 9 


的 民 六 习 约 中， 在 本 例 中 ， 对 数 似 然 函 数 为 nlog -= —"logo 
-站 p23 (m% 一 4)?。 通过 求 偏 导数 并 命 之 为 0, 得 出 方程 


~—n/o + (ma) /on 一 0， Bm)/0: 一 0、 (2.18) 


se 506 。 


象 (2.18) 这 样 ,通过 对 似 然 函数 或 对 数 似 然 函 数 求 导 而 得 的 方程 ， 
称 为 似 然 方 程 ， 在 了 豆 导 而 fz, 6) 在 日 上 的 最 大 值 点 在 的 由 
部 时 , 它 必然 是 似 然 方程 的 根 .但 由 于 我 们 不 一 定 在 每 一 具体 场合 
都 明确 这 些 条 件 是 否 成 立 , 且 似 然 方 程 也 可 以 不 止 一 个 根 ,因此 往 


往 还 需要 色 过 验证 ， 才 能 肯定 似 然 _- 解 是 (或 不 是 ) 极 : 
似 然 估计 . 对 本 例 而 言 , 易 算 出 (2.18) 有 唯一 解 
2 一 豆 "一 二 (CE 一 一 ) "一 mo (2.19) 


且 不 难 验 证 它 确 是 极 大 似 然 估计 (习题 1). 
例 2.9 具有 概率 密度 函数 


1 
fem) FIFO 一 co <<0< co (2.20) 


的 分 布 称 为 Gauchy 分 布 、 参 数 9 可 以 取 任 意 实 数值 . 
现 设 豆 ;，…， 瑟 为 抽 自 具 Cauchy 分 布 的 总 体 的 简单 随机 
样本 , 要求 8 的 极 大 似 然 估 计 . 本 例 似 然 方程 为 


< vi:—0 
I (2.21) 


这 方程 只 能 用 数值 解 , 比方 说 , 用 牛顿 法 , 而 以 样本 中 位 数 作为 初 
始 值 ， 注 意 ， 分 布 (2.20) 关 于 9 对称, 故 6 就 是 总 体 分 布 中 位 数 . 
这 个 分 布 不 存在 期 望 值 , 因此 不 能 用 矩 法 估计 9. 

例 2.10 设 简单 随机 样本 12?~ 忆 (0 9), 98>>0; 或 2 一 已 
(2，b)， 一 co< 凡 < 名 < oo。 写 出 这 两 个 情况 下 的 似 然 函数 ， 直 
接 看 出 极 大 似 然 估计 为 ，1°*6 一 max(1,…, 下 ,), 2° 负 一 min 
《入 1， “* 太 ，,)， 06, = max( 玉 1, 三 二 卫 ,). 本 例 似 然 函 数 不 连 续 ， 
不 能 用 似 然 方 程 求解 . 

例 9.11 再 考 虚 例 1.5，、 仍 设 元 件 寿 命 的 分 布 为 (1.8), 但 把 
试验 方式 作 如 下 的 修改 : 指定 一 个 时 刻 >>0， 试 验 进 行 到 全 部 折 
出 的 ”个 元 件 都 失效 ， 或 到 时 刻下 为 止 . 记 忒 ,一 元 件 的 寿命 
或 T, 视 元 件 在 时 刻 卫 时 已 失效 或 否 而 定 ， 要 由 i, -…, XX 作 义 
的 极 大 似 然 估计 . 

车 二 T， 则 总 体 分布 在 mm 点 的 密度 为 ee 若 zw 一 了 ， 则 

se br » 


表示 “元 件 的 寿命 > 了 ,其 概率 为 | Xe dz 一 on， 故 单个 样 


本 wi 的 概率 函数 , 应 为 Xe “或 e ”7, 视 vw;< 了 或 否 而 定 。 现 为 方 
便 计 ， 设 前 了 个 元 件 在 时 刻 卫 前 已 失效 ,而 后 呈 一 人 个 则 否 ( 必 要 
时 这 可 通过 调整 样本 的 编号 达到 )， 则 似 然 函数 为 

flz, 入 ) — Me Mt tte)o Mn DY 


和 一 寺 [ 开 : 十 … 十 闷 十 下 站。 


易 验 证 这 确 是 和 的 极 大 似 然 估计 . 
本 例 中 的 试验 叫 定时 截 尾 试验 ， 另 一 种 方式 是 先 定 下 一 个 自 
然 数 7, 待 有 7Y 个 元 件 用 坏 时 试验 即 停止 ， 这 叫做 定数 截 尾 试验 . 
也 可 以 两 种 鹤 尾 都 有 本 例 一 个 有 趣 之 处 在 于 : 它 的 概率 函数 是 
“混合 式 ” 的 : 既 不 全 然 是 概率 密度 , 也 不 全 然 是 离散 和 概率. 

例 2.12 设 有 大 个 事件 41, …, 4 两 两 互 斥 ,其 概率 pi, …， 
Pr 之 和 为 1， 将 试验 独立 地 重复 nw 次 ， 以 于 : 记 4 发 生 的 次 数 ， 
& 一 工 ， "+ 求 Di， ,DE 的 极 大 似 然 估计 , . 

此 处 (于, “1, 了 ;) 服 从 多 项 分 布 M(n; p1, 3 Pe); 其 概率 落 
数 为 二 二 人 8…2W、 取 对 数 并 在 十 … 十 pr 一 1 的 条 件 下 求 
极 值 , 易 算 出 极 值 点 为 

Di 二 玉 /n, =1, “3 £. 
且 不 难 验 证 这 确 是 极 大 似 然 舍 计 , 当 =2 时, 得 到 二 项 分 布 的 恨 
形 . 

在 有 些 问题 中 ,2a， ***, Dr 都 是 另 一 些 参数 Oi, ” ”7 0. 的 函数 ， 
7<h， 这 时 ,去 掉 与 四 ,…, 0, 无 关 的 部 分 后 , 得 对 数 似 然 函 数 为 
Slog pO, “5 0,). 通过 建立 似 然 方程 找 出 0,, 5 0, 的 极 什 
点 向 ,…, 6,, 若 能 验 明 这 确 是 最 大 值 点 , 则 得 到 p; 的 极 大 似 然 估 
计 为 By, …, 忆 ), 这 一 般 与 (3.23) 不 一 样 . 一 个 实际 例子 如 下 : 
人 的 血型 有 0, A, B, AB 四 种 ,决定 血型 的 基因 有 A.B.O 三 种 ， 
ea DB 。 


子 代 的 血型 由 父母 各 出 一 基因 构成 : 00 为 DO 型, AA 和 AO 为 人 
型 ,BB 和 BO 为 了 型 ,AB 为 AB 型 (AO 表示 : 父母 之 一 提供 基因 
A， 男 一 提供 0. 余 类 推 )。 在 特定 的 一 群 人 (如 某 一 地 区 某 一 人 
种 ) 中 , 基因 A、B.O 的 频率 01，0。, 0 无 法 直接 观察 , 而 一 个 人 的 
血型 则 可 测定 ， 以 2 Pa, ps, ps 分 别 记 OQ、A、B.AB 这 四 种 血型 
的 频率 , 则 应 有 (注意 bs 二 08 一 1) 
p= 63, pa—20084+03, ps™~=200s+ 03, ps—20,. 
(2.22) 
从 这 一 群 人 中 随机 地 抽出 w 个 (假定 这 一 群 人 数 相对 于 %% 很 大 , 以 
至 抽 祥 可 近似 认为 是 有 放 回 的 ) ,分别 以 mm, ra, ns 和 ma 记 其 中 具 
血型 0.A.B、AB 的 人 数 , 则 为 得 峡 ， ba， ba 的 极 大 似 然 估计 , 要 找 
Gam(20.08+ 0 "2008+ RB)"20.02)™ (2.23) 
在 Out 0s 十 0 一 1 的 约束 下 的 极 什 点 ( 钢 , 作 , 6)， 这 具 能 用 数值 
方法 求解 . 
矩 估 计 和 极 大 似 然 估计 是 两 种 基本 的 点 估计 方法 . 在 82.8 
中 将 看 到 , 从 大 样本 的 观点 看 , 极 大 似 然 估计 一 般 优 于 点 估计 ， 以 
此 之 放 ， 它 受到 更 大 的 重视 . 但 矩 估 计 也 有 其 优点 .一 则 它 对 样 
本 分 布 形式 要 求 少 ; 在 极 大 似 然 估计 的 情况 ,概率 函数 须 有 简单 的 
解析 表达 式 ,参数 9 也 需 取 值 于 欧 氏 空间 . 对 矩 估 计 则 无 这 英 限 - 
制 , 如 例 2.5. 另外 ， 在 第 估计 法 能 用 的 场合 ， 其 计算 一 般 比 极 大 
似 然 估计 简单 些 . 


(三 ) 若 于 历史 情况 

窍 估计 法 最 初 是 由 及 . Pearson 在 1894 年 一 项 工作 中 提出 来 

的 、 在 1894~1902 年 期 间 他 发 表 了 一 系列 工作 , 涉及 这 个 方法 . 

其 中 最 重要 的 是 1902 年 发 表 在 Biometrika 上 的 文章 ，Pearson 

关于 和 矩 估 计 前 工作 是 与 他 所 提出 的 一 个 著名 的 分 布 族 -Pearson 
分 布 族 密切 相关 . 

在 上 世纪 很 长 一 段 时 期 , 有 一 些 学 者 , 包括 生物 学 家 兼 统计 学 

家 了 . Galton, 认为 在 实际 问题 中 出 现 的 数据 , 基本 上 都 可 以 用 正 

* 069 。 


态 分 布 来 描述 . Pearson 考察 了 一 些 生物 学 方面 的 数据 ， 发 现 不 
少 有 显著 的 偏 倚 ， 而 不 适合 用 正 态 分 布 ( 它 是 对 称 的 ) 去 描述 。 他 
从 某 些 一 般 人 性 考虑 出 发 , 提出 了 一 个 微分 方程 
站 
rr (2 24) 
而 把 适合 这 方程 的 所 有 概率 密度 函数 y(2) 挑 选 出 来 ,构成 一 个 分 
布 族 ， 后 人 将 之 称 为 Pearson 分 布 族 ， 它 含有 四 个 参数 0、c、 
Gd. 这 是 一 个 颇 大 的 分 布 族 : 正 态 分 布 , 指数 分 布 以 及 只 直 辽 等 重 
要 分 布 都 属于 这 个 族 , 整个 族 又 分 为 若干 个 子 族 - 类 型 例如 , 在 
极 值 统计 中 重要 的 Gamma 分 布 , 就 属于 Pearson IIIL 型 . 
Pearson 认为 , 这 个 分 布 族 足 够 用 以 描述 生物 学 上 的 数据 . 问 
题 在 于 对 一 组 特定 的 数据 , 要 适当 选择 参数 a.5.c.d.。，Pearson 注 


意 到 ， 这 些 参 数 训 表 为 密度 4 的 前 四 阶 矩 mw 一 | ”y(2)w'dz，i 一 


1, …， 4 的 函数 .因此 他 提出 用 样本 窍 ww 估计 ou 并 代入 这 些 函 

数 ， 就 可 得 到 a, 8, e, 4 的 估计 .不 过 ,Pearson 实际 上 不 是 把 这 

当成 一 个 方法 直接 提出 来 , 他 是 从 “曲线 拟 合 ? 的 观点 来 处 理 问题 ， 
矩 估计 方法 是 他 由 此 所 作出 的 结论 . 

要 说 清楚 Pearson 的 想法 , 须 得 介绍 一 下 一 个 常见 的 统计 概念 

一 一 直方 图 设 有 了 

观察 数据 即 样本 下 1 

…， 玉 。 选择 两 个 适 

当 的 常数 g.h, h>>0. 

把 《一 co，co) 分 为 一 

些小 区 间 水 一 [9 十 他 

一 了 Dh, 9g 十 访 ), 6 一 0, 二 1 土 3,…, 以 mw 记 瑟 :， …， 马 。 中 落 在 

4 内 的 个 数 ， 以 4 为 底 , mw/ (mA) 为 高 作 一 矩形 , i 一 0， 土 1， 土 久 

…, 就 得 到 一 个 如 右边 那 种 形状 的 图 形 , 这 就 是 直方 图 ， 它 定义 的 

函数 9《z) 一 ray (mR), 当 wE4 可 以 作为 总 体 分 布 密度 函数 的 一 个 

估计 : 因为 总 共 作 了 9 次 观察 , 落 在 di 内 的 有 nm 次, 故 总 体 分 布 在 


e BO 。 


4 内 的 概率 , 可 以 用 wjm 去 信 计 . 而 ww/(mh) 就 是 4 内 单位 长 的 
概率 ( 即 密度 ) 的 估计 . Pearson 用 最 小 二 乘 准则 : 确定 参数 a、 6b、 


cd, 使 由 (2.24) 确 定 的 密度 yC%), 使 | (y(2) -多 Co) )*dw 达到 最 
小 ， Pearson 在 其 1902 年 文章 中 证 明 ， 若 略 去 其 些 高 次 项 不 计 ， 


则 这 个 最 小 二 乘 问题 的 解 为 : 取 a.5.c.d, 使 | yz)side( 一 om) 
一 阶 样本 矩 am, % 二 1，…, 4. 

在 现代 数理 统计 学 中 ,对 Pearson 分 布 族 的 重要 性 的 估计 , 不 
象 当初 Pearson 设想 的 那么 高 .但 是 他 在 这 些 工作 中 所 发 展 的 矩 
估计 法 , 则 一 直 被 当 作 一 个 普遍 有 用 的 点 估计 方法 而 受到 重视 . 

极 大 似 然 估计 是 及 . A. Fisher 在 1912 年 的 一 项 工作 中 提出 
来 的 ， 在 正 态 分 布 这 个 特殊 情况 下 ， 这 方法 可 追 湖 到 Gauss 在 上 
世纪 初 关于 最 小 二 乘法 的 工作 。 Fisher 在 上 述 1912 年 工作 中 ， 
批评 了 上 矩 法 和 最 小 二 乘法 , 提出 了 极 大 似 然 估计 法 . 

Fisher 走 的 是 与 Pearson 不 同 的 路 线 。 他 认为 ,统计 问题 模 
型 的 选 定 不 是 一 个 数学 问题 ， 而 要 根据 实际 。 他 是 在 假定 已 选 好 
模型 f(w, 6) 的 条 件 下 , 去 考虑 参数 9 的 估计 问题 . 这 个 提 法 与 现 
代数 理 统计 中 点 估计 问题 的 提 法 一 致 ， 这 个 思想 他 在 以 后 一 些 工 
作 , 特别 是 前 面 多 次 提 到 的 他 的 1922 年 工作 中 , 作 了 发 挥 ， 他 提 
出 极 大 似 然 估计 法 所 依据 的 想法 ， 基 本 上 就 是 我 们 在 定义 似 然 函 
数 时 所 解释 的 . 

Fisher 很 重视 极 大 似 然 估 计 ， 在 上 述 1922 年 工作 中 ， 尤 其 
是 在 1925 年 发 表 的 《Theory of statistical estimation3 一 六 中 ,对 
这 一 估计 作 了 许多 研究 ， 顺 便 提 一 句 ， 上 述 1925 年 工作 , 一 般 认 
为 是 近代 点 估计 理论 的 奠基 性 工作 . 

另 一 个 要 注意 之 点 是 , Fisher 更 多 地 是 从 < 极 大 似 然 估计 能 集 
中 姓 本 星 的 多 少 信息 ”这 个 角度 ， 去 研究 这 个 估计 的 . 那 一 个 时 
期， 也 已 提出 了 充分 统计 量 的 概念 ， 有 一 段 他 相信 , 极 大 似 然 估计 

谍 必 是 充分 统计 时 ， 因而 在 “集中 信息 ”这 个 角度 看 是 优越 的 ， 后 
米 包 发 现 了 这 一 点 不 对 ， 现 在 我 们 很 容易 举 出 反例 (习题 5)， 不 
* 6h， 


过 , 在 这 些 研 究 中 所 发 展 的 一 些 概念 ， 如 Fisher 信息 量 等 , 在 以 
后 的 工作 中 有 很 大 的 影响 ， 生 不 论 极 大 似 然 估 计 在 实用 上 的 极端 
重要 人 性， 就 以 它 在 理论 上 的 促进 作用 来 看 ， 也 是 极 显著 的 .可 以 
涪 , 由 Fisher 开始 的 工作 , 直到 现在 仍 是 热门 的 研究 课题 . 

在 一 般 统计 教 本 和 著作 中 , 大 抵 都 有 这 样 的 看 法 : 作为 一 种 估 
计 方 法 , 极 大 似 然 估计 优 于 和 抢 估 计 . 但 有 的 学 者 也 指出 : 在 一 般 地 
肯定 这 一 点 的 同时 , 也 应 注意 到 : 二 者 的 出 发 点 , 即 所 要 解决 的 问 
题 , 多少 有 些 不 同 ，Pearson 要 解决 的 , 是 用 最 小 二 乘法 作曲 线 拟 
合 的 问题 ， 作 为 这 一 问题 的 解 ( 在 Pearson 曲线 族 内 )， 和 矩 法 优 于 
极 大 似 然 法 ， 


$2.2 无 偏 估计 


(一 ) 无 偏 估 计 和 一 致 最 小 方差 无 偏 估 计 
无 偏 估计 的 概念 , 前 在 例 1.16 (结尾 处 )、 例 2.1 及 其 他 几 处 
地 方 都 已 提 到 过 了 .现在 再 将 其 正式 定义 表述 如 下 ， 
定义 2.4 设 样本 且 的 分 布依 赖 参数 9, 9 在 参数 空间 @ 内 
取 值 ,9( 信 是 定义 于 @ 上 的 已 知 函 数 ( 取 实数 或 实 向 量 为 值 )， 
学 ZE) 是 9(9) 的 一 个 估计 量 。 如 果 
9( 了 ) 一 g9(0), 对 任何 9E8， (2.25) 
则 称 95CX) 为 gC9) 的 一 个 无 偏 估计 (符号 ,的 解释 参看 例 2.2). 
估计 的 无 偏 性 这 个 概念 ， 体 现 了 我 们 在 $1.3 (二 ) 中 提 到 的 
“频率 学 派 ”或 “古典 学 派 "的 思想 . 即 这 个 概念 只 有 在 大 量 重复 下 
才 碍 意义 ， 设 想 这 释 一 不 和 情况， 每 天 作 抽样 以 对 9( 全 进行 估计 . 
第 天 的 样本 为 筷 @, 估计 值 为 多 ( 开 @) ,一 共 作 了 一 天 . 设 互 ， 
， 节 外 是 独立 间 分 布 的 , 则 如 9 有 无 偏 性 ， 按 大 数 定 律 ， 以 概率 
1 当 mn->co 时 有 
LIUHXH > BX) -0). 
就 是 说 , 尽管 一 次 估计 的 结果 9( 且 外) 不 一 定 怡 好 等 于 g(9), 但 在 
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大 量 重复 使 用 时 , 多 次 估计 的 算术 平均 值 , 可 以 任意 接近 被 估计 值 
9g(9)， 如 果 这 估计 量 9 只 用 一 次 , 则 无 偏 性 这 个 概念 实际 上 不 说 
明 什 么 问题 ， 因 为 9 为 无 偏 并 不 保证 在 任何 情况 下 ( 即 对 任何 样 
本 ), 估计 值 9( 邓 ) 必 重合 于 9(8). 无 偏 性 只 是 保证 了 没有 系统 误 
差 , 即 用 9 估计 g(9) 时 , 不 是 系统 地 偏 高 或 偏 低 ， 它 可 以 有 偏差， 
但 偏差 是 随机 性 的 , 有 时 大 于 0， 有 时 小 于 0, 而 平均 为 0。 问题 在 
于 这 “平均 为 "一 点 , 只 有 在 大 量 重复 时 才能 体现 出 来 . 

因此 , 估计 的 无 偏 性 对 现实 问题 的 意义 如 何 , 必须 根据 这 问题 
的 具体 情况 去 考察 ， 举 两 个 例子 。 设 一 商店 每 日 从 一 工厂 中 取 货 
一 批 。 每 次 取 货 时 ， 从 批 中 随机 抽出 一 些 产 品 以 对 其 废品 率 p 作 
估计 , 设 每 批 有 六 件 ,每 件 单价 为 a 元 ,双方 议定 ; 若 某 日 2 的 估 
计 值 为 $, 则 商店 付 给 工厂 六 (1 一 们 5 元 .这 时 , 对 一 日 的 情况 而 
言 , 2 可 能 偏 高 或 偏 低 , 因而 有 一 方 要 吃 一 点 亏 、 但 从 长 远 看 , 若 
2 是 jp 的 无 偏 估计 , 则 平均 说 来 那 一 方 都 不 吃亏 、 在 这 个 例子 中 ， 
无 偏 性 无 疑 是 一 个 很 有 用 、 很 合理 的 准则 . 

现在 设想 这 样 一 个 情况 ， 某 工厂 每 周 进 原料 一 批 。 在 投入 使 
用 前 , 由 工厂 实验 室 对 原料 中 某 种 成 分 合 量 的 百分率 wp 作 一 估计 . 
根据 估计 值 廊 采取 相应 的 工艺 调整 措施 .无 论 在 那 一 次 比 真正 
的 p 偏 高 或 偏 低 ,都 会 使 所 采取 的 措施 不 理想 而 有 损 于 产品 质量 . 
在 此 ,纵使 分 是 2 的 无 偏 估计 ,在 长 期 使 用 中 , 各 周 的 估计 偏差 也 
不 能 正 负 抵 消 。 因此 在 本 例 中 , 估计 久 的 无 偏 性 就 没有 多 大 实际 
意义 . 

不 过 ,在 目前 点 估计 的 理论 和 实用 中 , 无 偏 性 仍 占 据 很 重要 的 
地 位 .除了 历史 的 因素 外 ， 还 有 两 个 原因 .一 是 无 篇 性 的 要 求 只 
涉及 一 阶 矩 (均值 ) ,在 数学 上 处 理 较 方 便 ， 另 外 ,在 没有 其 他 合理 
准则 可 循 时 , 人 们 心理 上 觉得 : 一 个 有 无 偏 性 的 估计 , 总 比 没有 这 
种 性 质 的 估计 好 些 . 

无 偏 估计 的 实例 在 前 面 已 提 到 一 些 。 如 例 1.1 和 1.2 中 , 用 
样本 废品 率 估计 整 批 废品 率 ; 例 工 .4 中 , 分 别 用 样本 均值 对 和 样 
本 方差 8? 估计 正 态 分 布 W(ec, o”) 中 的 和 o?*. 例 1.5 中 用 样本 
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均值 估计 总 体 分 布 均值 过， 一 般 地 ,如 (2.3) 式 指出 的 ,用 样本 原 


点 矩 qn 估计 总 体 原点 矩 mw 是 无 偏 的， 但 样本 中 心 矩 mm 不 是 总 
体 中 心 矩 ww 的 无 偏 估计 ， 不 过 可 以 证 明 ; 偏差 随 样本 大 小 mm 增加 


而 变 得 可 忽略 不 计 ， 一般 有 mos= 10( 芋 


一 个 参数 的 无 偏 估计 往往 不 止 一 个 。 另 外 , 也 有 些 情况 ,其 中 
根本 没有 无 偏 估计 . 

例 2.18 设 样本 总 ~ B(n, p), n 已 知 而 wp 为 未 知 参 数 (样本 
大 小 为 1), g(p) 一 sinp， 因 为 肚 只 取 0, 1,…, nm 这 些 值 ,为 定义 
一 个 估计 量 9， 只 须 指 出 9( 引 之 值 m 即 可 ,6 一 0, …, wn。 车 9 为 
无 偏 , 则 依 定 义 2.4, 应 有 


从 名 种 _ , , 
Bx)- 训 a( ?JC -9)" gD) sinp, 0<p<1, 


得 以 < 人 ( |] Co 是 的 w 阶 允 项 式 , 它 不 可 能 在 一 个 区 间 


(0, 1) 上 处 处 等 于 一 个 超越 函数 sinp， 以 此 知 sinp 没 有 无 偏 信 
计 其 砸 例子 见 本 章 习 题 ， 

无 偏 估计 有 既然 一 般 不 唯一 , 就 存在 一 个 从 其 中 挑选 的 问题 . 为 
此 就 必须 引进 一 定 的 准则 作为 挑选 的 根据 ， 下 面 采用 均 方 误差 准 
则 , 这 是 统计 上 常用 的 一 个 准则 .我 们 设 9%(0) 为 一 维 的 ， 

设 用 9( 肚 ) 信 计 g(0)， 则 一 般 闪 及) 一 g(9) 不 为 0( 如 前 指 
出 的 ， 即使 9 为 无 偏 r- 世 是 如 此 )， 它 是 估计 量 9 在 这 一 具体 场合 
(具体 的 样本 及) 下 的 误差 .把 这 误差 平方 以 消除 符号 的 影响 , 得 
[9(X) ~g(9)1?， 这 个 量 仍 是 随机 的 ,再 计算 其 均值 , 以 得 到 一 个 
整体 性 指标 Bo[9( 于 ) 一 9(0)]”, 这 就 是 估计 量 9 的 均 方 误差 , 常 
记 为 MSFP5( 信 CTSE 是 Moan Sa Square Error 的 缩写 ). ”在 这 个 淮 
则 下 ， 考 由 和 gs 为 两 个 估计 量 而 MSE,(91) < MSE, (92) 对 一 切 
9E@, 且 不 等 号 至 少 对 @ 中 的 一 个 0 值 成 立 , 则 gi 优 于 gs. 

当 引 为 9(9) 的 无 偏 知 计时 ,有 MSEs( 人 一 Varo( 们 , 即 了 的 方 
差 。 于 是 按 均 方 误差 准则 , 在 无 偏 估计 类 中 ,方差 念 小 愈 优 ， 这 个 
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考虑 引导 到 下 面 的 定义 ， 

定义 2.5 设 9 为 gC(9) 的 一 个 无 偏 估计 . 车 对 g(9) 的 任 一 
无 偏 估 计 91, 都 有 . 

Vare( 9) < Varol 91), 对 一 切 6E@ (2.26) 

则 称 9 是 g(9) 的 一 个 一 致 最 小 方差 无 偏 估计 ， 简 称 为 UMYV UE 
(是 Uniformly Minimum Variance Unpbiased Estimate 的 缩 
写 ). 

本 节 下 面 几 段 中 将 讨论 求 UMVUE 的 几 个 重要 方法 (确切 地 
说 ,是 证 明 某 一 特定 估计 为 UMVUE 的 方法 ). 在 这 项 工作 中 , 下 
面 的 性 质 起 简化 问题 的 作用 , 有 重要 意义 ; 

引 理 2.1 设 了 一 全 ( 瑟 ) 是 一 个 充分 统计 量 ,而 9( 民 ) 是 9(09) 
的 一 个 无 偏 佑 计 。 则 存在 可 表 为 下 的 函数 的 无 偏 估计 CTC))， 
使 

Vare(h(T( 有 )) EVaro 9(T)), (2.27) 

等 号 当 且 仅 当 9( 卫 ) 能 表 为 了 T( 卫 ) 的 函数 时 才 成 立 . 

证 因为 充分 统计 量 , 故 按 定义 , 在 给 定 人 工时 , 样本 对 的 
条 件 分 布 与 参数 9 无关， 因此 , 在 给 定之 下 , 9( 了 也) 的 条 件 期 望 
oC9( 怀 )| 卫 ) 也 与 9 无关, 可 记 为 h(T)， 现 因为 无 偏 估计 ， 有 

; 站 EA . A OTD, =9(0), 
因此 ,%(T()) 为 gC9) 的 无 偏 估计 ， 现任 取 960E8, 有 
1a(T(R))= LB.(9( TF) TE IF)IT). 
最 后 两 项 之 差 为 Varoe,(9( 邓 )|T)， 当 和 且 仅 当 在 给 定 人 的 条 件 下 
9( 焉 ) 为 一 常数 ,也 就 是 9( 王 ) 可 表 为 算 的 函数 时 , 它 才 等 于 0, 因 
此 Bohs(T(F)) EBo Bo lg (TIT) Bog (TT), 而 
Varo, (A(T(X )) 
= Boa(T(R)) — 0) SBoG (TF)— g(0o) 
=Varo(9(X)), 

等 号 当 且 仅 当 9(《 卫 ) 可 表 为 了 的 函数 时 才 成 立 ， 引 理 证 毕 . 

据 雍 ,在 有 充分 统计 量 卫 时 ,为 求 UMVUE, 只 须 考虑 能 表 为 
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了 的 函数 的 无 偏 估计 类 ， 


(二 ) 零 无 偏 估计 法 

以 下 我 们 沿用 上 一 段 的 记号 。 本 有 段 介绍 一 个 一 般 性 定理 ,用 
以 判明 某 一 估计 量 是 否 为 UMVUE. 

定理 2.1 设 9( 卫 ) 为 g(9) 之 一 无 偏 估 计 , Vare(9())<<oo 
对 任何 9EB@， 且 对 任何 满足 条 件 “Bdl( 节 ) 一 0 对 一 切 9E6” 的 统 
计量 2 必 有 

Cove(gCX), HR)) = BIC(FNF)) =0, 
一 切 0€0, (2.28) 
则 9( 互 ) 是 9(0) 的 UMVUE. 

从 形式 上 看 ,条 件 “ 召 LC 且 ) 一 0 对 一 切 9€6B” 可 解释 为 “1 对) 
是 零 的 无 偏 估 计 ”.。 以 此 得 到 本 方法 的 名 称 . 

证 设 轴 (和 ) 为 g(9) 的 任 一 无 偏 估计 ， 记 信 对 )= 纪 (XX) 一 
g( 了 于), 则 以 卫 ) 为 零 的 无 偏 估计 , 故 (2.28) 成 立 , 因 而 

Vare(g1())—= Varo(9( 玉 ) 十 区 总 )) 
一 Varo(9( 玉 )) 十 Vare(l( 了)) 
二 2Qove(9(), 性 芋 )) 
一 Vare(g( 且 ))+Varoe(l( 玉 )) 
>Varo(9( 卫 )). 
这 证 明了 所 要 的 结果 . 

从 定理 的 内 容 看 出 ， 它 是 一 个 验证 某 个 特定 的 佑 计量 59 为 
UMVU 也 的 工具 .至 于 这 个 特定 的 9 从 何 而 来 ， 只 能 笼统 地 说 ， 
一 般 是 基于 直观 的 想法 提出 的 、 看 求 是 很 好 的 估计 . 如 果 我 们 无 
法 用 这 种 或 那 种 考虑 “ 捉 ” 到 这 个 特定 的 9, 这 个 定理 就 无 所 帮助 ， 
条 件 (2.28) 的 验证 也 不 容易 , 因为 零 的 无 偏 估计 很 多 ,但 是 ,前 面 
一 些 例子 中 提 到 的 几 个 常用 估计 ,都 可 用 此 法 验证 其 为 UMVUE. 

例 2.14 设 一 事件 4 的 概率 pp 未知， 独立 地 作 % 次 试验 , 记 
民 一 工 或 0, 视 第 次 试验 中 事件 4 发 生 与 否 而 定 , 4 一 二 mw 
求 p 的 UMVYUE, 
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记 了 (于) 一 于 1 十 … 十 下 ,( 玉 一 ( 玉 1,…， 昼 ,))， 如 在 例 1.19 
中 证 明 的 ,了 为 充分 统计 量 . 按 引 理 2.1, 可 以 局 限于 可 表 为 了 的 
函数 的 无 偏 估计 类 ， 现 取 9=T/n, 来 验证 它 满足 定理 2.1 的 两 个 
条 件 . 首先 很 明显 , 9 是 p 的 无 偏 估计 ， 且 Vars( 们 一 co 对 0<<p 
<1.。 现 设 1 一 1( 了 也) 为 零 的 无 偏 估计 , 并 记 一 1 一 0，…，w， 
则 因 了 ~B(w, p), 有 

-高 of jad -ao Ox<p<1., 
二 0 + 

约 去 因子 (1 一 p)", 并 记 s 一 p/ (1 一 p)(s 取 值 于 C0, co))， 上 式 可 改 
写 为 So? js-o 一 切 sE(0, co)， 由 此 知 a )-0, 4 一 0， 

i=1 名 
… %， 即 4 一 0, 5 一 0,…, mn。 因而 估计 量 1 只 取 0 为 值 。 这 时 
《2.28) 当 然 成 立 , 由 此 证 明了 ; 频率 T/n 确 是 jp 的 UMVUE. 

例 2.15 回 到 例 1.5, 求 总 体 分 布 均 信 二 的 UMVUE. 


在 例 1.23 中 已 提出 :了 了 ( 且 ) = 二 及 1 十 … 十 及 为 充分 统计 量 . 又 
在 例 1.13 中 ， 已 求 得 PT 的 密度 函数 为 QL.20). 到 9=T/w， 风 9 


为 元 的 无 偏 信 计 , 且 Var,( 人 <oo 对 >0， 现 设 1~1T) 为 零 的 
无 偏 估计 , 则 由 (1.20) 式 ,有 

0= BP) -TT | No-*00n-11(w) dy, >0, 
即 | ” 1Kz)e-xeor-idz 一 0， 两 边 对 入 求 导 数 ,得 | ~ ol (2) erat dy 
一 0, 即 妃 .(ZTUCT)) 一 0 对 一 切 和 >>0, 因而 适合 条 件 (2.28)， 这 
证 明了 样本 均值 也-P/wn 是 宇 的 UMVUE 


例 2.16 回 到 例 1.24， 要 求 9 的 UMVUEB.， 在 该 例 中 已 证 
明 ， 统 计量 了 = 了 T( 肚 ) 一 max( 耻 1, …, 到 ,) 是 充分 的 ， 易 算出 TT 


的 分 布 ,因为 PT<)= P(t ….， ,< -1 Po( AX,<t) 


一 /" 当 0<t<0, 故 了 的 概率 密度 为 nw/ 由 ( 当 0<t<0, 其 他 
ea 67 。» 


处 为 0)， 取 9-9(T) 一 n+ 0 

Bog= | 有 -opt 2 tdt=0, 一 切 0>0， 
即 9 为 的 无 偏 佑 计 . 现 设 1 一 KZ) 为 零 的 无 偏 估计 ， 则 应 有 
| lw)ner-1/grdz 一 0 即 |, 1(w)wr-idw 一 0 对 一 切 9>0， 对 9 求 
导 ， 得 Kb)p 工 =0 对 一 切 09>0， 因 而 490)=0 当 0>0， 即 1 只 
取 0 为 值 ， 因 而 条 件 (3.28) 成 立 ， 这 证 明了 ， ?+ 人 是 9 的 


UMVUE 
例 2.17 设 和 1 …, 了 ,和 ~ 和 (a,03), 求 4 和 ao? 的 UMVUD. 


记 外 = (Ti, Ts)， 其 中 全 一 到 T= (nC—1)S = ZX 在 
例 1.21 中 已 证 明了 了 是 充分 统计 量 ， 又 根据 定理 1.1， 得 到 了 
的 密度 函数 为 

folti, ts) 一 3 BETA 一 DA” 


x (2 
( 当 一 co< 石 所 00, 妇 >0， 其 他 处 为 0， 又 0 一 (ac, o).) 
先 考虑 的 估计 . 令 9 一 9(T) 一 Ti, 则 9 为 9( 人 一 zx 的 无 仿 
估计 , 且 Vare(9) 二 oo、 现 设 1=1T) 为 零 的 无 偏 估计 , 则 BCT) 
一 0， 按 (2.29), 此 可 写 为 


| | l(t, to)oxp( 一 


n—1 ni \ ,a —ti/2903 
T(2 )c ) to- et/20 (2.29) 


一 ?十 如) )at dts—0, 


(2.80) 
对 一 切 wxE(- ce，ce) 和 f 灵 >>0， 两 边 对 < 求 导 数 , 得 
| | L(t, 一 9)2 十 妇 ) Jat dts =0. 


按 (2.29) ,此 即 
Covell, 9)— Bo TT 一 ao 一 0， 一 ceo<a<co，c>0， 


» 68 。 


因此 条 件 (2,28) 满 足 ， 这 证 明了 又 就 是 < 的 UMVU 了 完全 同 
样 的 方法 证 明 : Ta/(w 一 1)=S? 是 o? 的 UMVUE. 
比较 例 2.16 和 例 2.17， 我 们 看 到 这 样 一 个 现象 :在 例 2.16 


中 ,总 体 均值 为 9/2, 其 UMVUB 是 3 max( 天，…， 耻 。)， 


而 在 例 2.17 中 ， 总 体 均 值 4 的 UMVU 了 为 样本 均值 于. 在 例 


2.16 中 ,下 上 比 2 二 max( 收 1, …， 也 ,) 要 差 些 ,而 在 例 2.17 中 则 


反 过 来 。 因 此 , 某 一 统计 量 , 或 者 说 , 使 用 该 统计 量 的 统计 推断 方 
法 , 其 优越 性 如 何 , 不 仅 取决 于 这 统计 量 本 身 , 还 要 看 统计 模型 是 
怎样 的 . 


(三 ) 充分 -完备 统计 量 法 

本 方法 实际 上 可 以 看 成 是 定理 2.1 的 一 个 特例 ， 只 因 它 涉及 
一 个 重要 的 概念 一 一 统计 量 的 完备 性 ， 我 们 把 它 摆 在 与 定理 2.1 
平行 的 地 位 ， 

设 工 为 一 充分 统计 量 ， 据 引 理 2.1， 若 g(9) 的 UMVUE 存 
在 , 它 必 能 表 为 了 的 函数 。 如 果 进 一 步 知道 ; 能 表 为 全 的 郴 数 的 ， 
9(0) 的 无 偏 估计 唯一 , 则 它 就 是 gC(9) 的 UMVUE， 显然 , 当 且 仅 
当下 述 条 件 成 立时 ,能 表 为 了 的 函数 的 , 9(9) 的 无 偏 估计 才 唯 一 
“和 任何 满足 条 件 Bol(T) 一 0( 一 切 9E6) 的 WT) 必 为 0”"。 这 个 性 


质 就 取 作 为 统计 量 了 的 完备 性 的 定义 ， 
定义 3.6 设 了 为 一 统计 量 ( 不 必 是 充分 的 ) .车 对 任何 满足 
条 件 
BEAT(R)) =0, 一 切 0EB (2.81) 
的 必 T), 都 有 
PIT(X) 0;=1, —H OIE, (2.82) 


则 称 了 是 一 个 完备 统计 量 . 
注意 ,了 的 完备 性 不 仅 取决 于 多 的 形状 , 还 取决 于 祥 本 也 的 
分 布 族 ， 完 备 性 这 个 名 称 . 来 源 于 正 交 通 数 理论 中 的 一 类 似 概念 . 
s* 89 ， 


为 简单 计 , 设 统 计量 下 (并 ) 有 概率 密度 加 (人 , 虽 (2.31) 式 可 写 为 
[1 at—0, 一 切 9E0. (2.38) 


(Dhls)as 一 0 形式 上 可 看 成 是 与 加 正 交 ”, 于 是 ,条 件 (2.31) 
可 说 成 是 只 与 函数 系 {2, 2EB} 正 交 ”， 在 正 交 函 数论 中 , 落 了 为 
一 正 交 函数 系 , 且 不 存在 与 M 正 交 的 非 零 函数 , 则 称 M 为 完备 正 
交 系 ， 由 (2.83) 看 出 , 我 们 这 里 的 完备 性 正好 与 下 相当 ,不 过 我 们 - 
不 称 密度 函数 系 {hoe,，9E6} 完 备 而 称 统 计量 T 完备， 由 于 {ho, 9 
EQ@} 是 由 人 决定 的 ,这 种 称呼 并 不 影响 实质 . 

由 完备 统计 量 的 定义 并 根据 引 理 2.1, 或 直接 用 定理 2.1, 得 
到 

定理 2.2 设 了 J 为 一 个 完备 充分 统计 量 , 9(T( 卫 )) 为 g(9) 
之 一 无 偏 估计 ， 满 足 Vare(8(2( 瑟 ))<co 对 一 切 9EB， 则 9(T 
(对 )) 是 g(9) 的 唯一 的 UMVUE( 唯 一 性 是 在 这 样 的 意义 下 ; 车 9 
和 访 者 是 9( 人 的 UMVU 卫 , 则 Po(9yz 娘 ) 一 0, 对 一 切 9EG). 

完备 性 概念 是 Lebmann 和 Seheffe 在 1950 年 提出 来 的 。 十 
理 2.2 也 是 他 们 所 证 明 ,故常 冠 以 他 们 的 名 称 ， 现 在 举 几 个 例子 ， 

例 2.18 在 例 2.14 和 例 2.16 中 , 我 们 都 证 明了 在 该 处 引进 
的 充分 统计 量 全 满足 完备 性 条 件 , 由 此 可 知 ,在 这 两 个 例子 中 得 出 
的 UMVUE 都 是 唯一 的 . 


例 2.19 回 到 例 14.1， 考 虑 批 度 品 率 分 的 估计 (此 处 六 已 
知 , MM 为 参数 )， 令 (下) 一 下 :十 … 十 王 。 在 例 1.19 中 证 明了 
也 为 充分 统计 量 , 又 也/n 为 ML/N 的 无 偏 估计 。 因此 据 定理 2.2，， 


只 要 证 明了 也 为 完备 统计 量 ， 就 可 以 肯定 了 /mn 即 立 是 -天 的 只 
一 的 UMVUE， 设 KZ) 为 一 统计 量 ,满足 条 件 


Bar) = Su s/n )-0 M=0, 1, .…, N, 


令 放 一 0, 由 上 式 得 从 0) 一 0， 肯 令 天 一 二 得 
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1 1 
故 (1) =0， 继 续 下 去 ， 可 得 7 人 们 =0, 对 =0，1,…, mm。 这 证 明 
了 工 的 完备 性 ， 

例 2.20 回 到 例 2.15， 我们 来 证 明 ， 些 例 中 引进 的 统 计量 
了 一 和 iT … 十 加 是 完备 的 .这样 就 证 了 明了; 在 该 例 中 得 出 的 估计 
T/n 即 素 ,是 过 的 唯一 的 UMVUB 

事实 上 ,车 加.L)=0 对 一 切 和 >>0, 则 有 

| Tcz)on te “dr=0, A>0. 
这 就 是 说 , 函数 1z)o 的 Laplace 变换 为 0” 按 Laplace 变换 的 
唯一 性 , 即 得 KKz)o" 一 0, 因 而 Xc) 一 0、 明 所 和 欲 证 . 

对 重要 的 正 态 分 布 参数 ( 例 (2.17)) 也 可 以 证 明 辐 样 的 结果 ， 
现在 我 们 引进 一 个 判别 完备 性 的 一 般 定理 ， 它 包 拉 了 一 些 常见 的 
情况 ， 定 理 的 证 明 在 此 不 给 出 ， 可 参看 陈 希 括 《数理 统计 引 论 > 
Pp. 80~82. 


定理 2.3 设 样本 卫 有 概率 函数 祥和 
fo 0 一 OCOjexp(za0c)QaGC0) 十 AS 


or 人 eye- 


+ Tv) QO hy), bc6. (2.84) 
这 里 O(9), Q1(0), ”5 Qx(0) 只 与 9 有 关 ， Ti(%), "yy Th(w) 和 
A(w) 只 与 样本 有 关 , 则 统计 量 


T(X) 一 (ZX 全 )， ”3 TD)) 

是 充分 统计 量 .又 若 {(Qi(0)，…，@Qx(6):9EG@} 作 为 瑟 中 的 也 
集 有 内 点 , 则 外 也 是 完备 的 (注意 : 7 的 充分 性 是 定理 1.5 的 直接 
推论 ). : 

形 如 (2.34) 的 分 布 族 称 为 指数 型 分 布 族 ， 它 包含 了 许多 在 统 
计 上 重要 的 分 布 族 . 

例 2.21 设 Yi …， 和 ovN(o co 9 一 (g, c)， 易 见 世 
的 概率 密度 可 写 为 (2.34) 的 形状 , 其 中 一 2, Ts(#) 一 ws Ta(2) 


站 


-> Pia, Q(0) =a/0°, QO) = —1/20%,0(9) 一 (VB ) -exp 
(= as 7), 2=1 集合 (六 2, -5): _co<a<ce， o>0| 是 
R? 中 的 半 平 面 ,当然 有 内 点 ， 由 此 依 定 理 2.3, 知 下 一 (Ta，7Za) 为 
充分 完全 统计 量 ， 而 作为 儿 的 基数 的 估计 量 
天 一 了/ 心 > 一 《zs 一 TI/n)/ (nC— 1) 
分 别 是 5 和 cr2 的 无 偏 估 计 , 故 按 定理 2.2, 知 误 和 部 分 别 是 ca 和 
o3 的 唯一 的 UMVUE. 


(四 )C-R 不 等 式 法 

此 法 的 思想 如 下 ; 考虑 9(8) 的 一 切 无 偏 估计 的 类 DT 中 的 
估计 的 方差 有 下 确 界 d,(9)=inf{Varo(9):9EUo}， 若 能 找到 
gf 的 一 个 无 偏 估计 从， 使 Vare(g) 一 四 (9 对 一 切 2EB 则 大 
显然 就 是 g(9) 的 UMVUE， 在 1945 年 和 1946 年 ,0O. R. Rao 和 
开 . Oramer 独立 地 得 到 了 ds(0) 的 一 个 下 方 舍 计 ， 即 找到 了 一 个 
表达 式 必 (9)， 使 中 (0)<d,(0)， 所 得 到 的 不 等 式 称 为 Cramer- 
Rao 不 等 式 , 简称 CO-R 不 等 式 . 

这 个 不 等 式 的 严格 推导 要 假定 样本 分 布 满足 一 系列 的 正则 性 
条 件 . 下 面 我 们 先 形式 地 把 它 推出 来 ， 再 指出 推导 过 程 中 所 用 到 
的 假定 . 

设 样本 肝 有 概率 函数 f(z, 9), 且 为 确定 计 , 设 f(z, 9) 是 概 
率 密 度 (离散 的 情况 可 以 同样 处 理 )， 人 参数 9 是 一 维 的 , 在 R' 的 一 
个 开 区 间 日 ~ (a, 5) 上 取 值 (4 可 为 一 co， Bb 可 为 上 ce)，9(9) 为 待 
估 和 函数. 设 9(w) 为 g(9) 之 一 无 偏 估计 , 则 依 定义 ,有 


| GCw) f(z, dv=g(0), 9€0. (2.35) 
积分 的 范围 是 样本 空间 2、 两 边 对 0 求 导 ,得 
[9%) B20) go y'(0)., (2.36) 


又 注意 到 


”了 3 


| Fe our- (2.37) 
两 边 对 0 求 导 ,得 
af(z, 0) go— : 
: | — dz 一 0. (2.38) 
由 (2.36) 和 (2.38), 得 
人 [5 —9(0)1-2 0 dg’.0). 
将 此 式 写 为 
2 1 of (zx, 0) 
GO -ro rr Ye 
—9(0). 
用 Cauchy-Sehwarsz 不 等 式 , 得 
jr0C%) -gf Ce, 0) do [pregy SV) fe, Od 
>[g'(0)]’ (2.39) 
上 式 左边 第 一 项 是 Varo(8( 卫 )), 第 二 项 是 也 (2208 有 于- 全) . 
于 是 得 到 
Vare(8(X))>[g(O)]a/B(-208 SE ) (3.40) 
特别 , 当 g(9) 一 8 时 ,有 - 
Vars (G(X))>1/B, (eA) 
不 等 式 (3.40)， 或 其 特例 (3.4L)， 就 是 O- 了 及 不 等 式 ， 它 指出 了 
g(9) 的 无 偏 估计 的 方差 不 可 逾越 的 一 个 下 界 , 即 (2.40) 右 边 . 它 
就 是 我 们 上 文 提 到 的 中 (9). 
特别 ， 在 一 个 重要 的 情况 ， 其 中 人 一 (1 ”3 五,)， 而 太 1， 


***, 太 ， 独立 同 分 布 ， 总 体 概率 函数 为 fo. 这 时 , f(z%， 0) = fo(w1) 
"fo (an), 向 


9 


(2.41) 


Blog f(%, 6) _ < Olog fo(z) 
J 一 人 ! ~. (2.42) 


ss Td. 


pang PC aogPC ) 
人 0 0 
=H, 人 (S082). (2.43) 


但 万 ， (Sef 2 ) Ofolo) fev) 


-| Fy Fo Ov 
-| eg dm | fo dn-= 训 (D 0, 


故 (2.43) 式 为 0 把 (2.42) 式 两 边 平 方 再 求 均值 , 得 
Olog f(X, 的 Na 2 Olopg fol Xi) \” 
Bo( “80 | ) -这 Es(- 0) 


=nB, (08f (2H). (2.44) 
于 是 得 到 这 一 情况 下 的 O-R 不 等 式 ( 取 (2.41) 的 特例 )， 
1 
yr (2.45) 


1(0) =—B,( Sef Es)) -| 到 EY (sn) at. (2.46) 


现在 回 过 头 来 看 看 , 在 导出 (2.40) 式 的 过 程 中 ,用 到 了 那些 条 
件 ， 首先 不 待 言 ，g (9) 必 须 存 在 ， 其 次 , (2.35) 式 左边 必须 能 在 
积分 号 下 对 9 求 导 , 才能 推出 (3.36)， 最 后 , (2.37) 式 左边 也 须 在 
积分 号 下 对 96 求 导 以 得 到 (2.38)、， 这 些 条 件 麻烦 之 处 , 在 于 它 不 
仅 与 样本 分 布 f(x, 9) 有 关 , 还 与 所 讨论 的 无 偏 估计 9 有 关 。 可 以 
感 立 某 种 较 员 验证 的 充分 条 件 ， 下 面 就 是 其 一 : 

定理 2.& 设 开 ，…， 马 ,为 简单 随机 样本 ， 总 体 有 概率 函数 
fr， 参数 9 属于 一 开 区 间 ec 5), g(0) 为 在 (a, 2) 上 可 微 的 待 
佑 函数 ， 设 存在 函数 G(t, 9) ,满足 以 下 的 条 件 : 

1° Br (X11, 6)<00, 对 一 切 0€0Q. 

2° 对 任何 0€E0, 存在 80>0, 使 当 i»— o| 86 时 有 


ofy (t) 
| /i se 9)， 
则 当 9CX) 为 gC9) 之 一 元 偏 估 计时 , 必 有 (2.40)。 
bed ?4 学 


本 定理 的 证 明 是 纯 分 析 的 ,就 是 验证 在 这 两 个 条 件 下 , (2.35)} 
和 (2.37) 在 积分 号 下 对 68 求 导 为 合法 .仔细 证 明 过 程 在 此 从 上 略 ， 
可 参看 陈 希 括 《数理 统计 引 论 > 的 引 理 2.2.1, 本 定理 是 其 一 特 合 . 
下 面 举 几 个 例子 说 明 用 0-RR 不等式 求 UMVUE. 在 这 些 例 

子 中 都 不 难 验证 定理 2.4 的 条 件 1°、2° 成 立 . 
例 2.22 回 到 例 2.14， 在 本 例 中 , 总 体 有 概率 函数 f(D 一 
2», foC0) =1—%, 可 写 为 folt) 2 多 六 t=0, 1., Olog fo(X1) 
/9p= 元 生生 .于 是 开 加 一 TD、 由 (3.45), 知 2 的 任 一 
无 偏 估计 的 方差 不 小 于 p(1 一 p)/n。 但 无 偏 估计 苦 的 方差 达到 
这 个 界限 , 因此 就 是 2 的 UMVUE. 
例 3. 如 回 到 例 2.2。 总体 分 布 为 Poisson 分 布 (2.7) 在 本 


例 有 81ogfo( 焉 )/89 一 (一 9)/0, 由 此 得 TC9) 一 地 ， 当 样本 大 
小 为 ”时 ,6 的 无 偏 估计 方差 的 下 降 为 b/m。 无 偏 估计 及 的 方差 
达到 这 个 下 限 , 因此 就 是 0 的 UMVUE. 
例 2.24 回 到 例 2.15， 总 体 密 度 为 Xo-*, 得 
Olog (XR1) /, sv 
i (1 一 和 1) /2%, 


有 了 (~ 二. 待 司 函数 为 4( 入 < 六， 得 0 了 B 下 办 为 ( 训 7)/ 


m- 吉 一 二， 无 偏 信 计 县 的 方差 正好 达到 这 个 下 界 , 故 就 是 
th 


六 的 UMVUE 


以 上 除 例 2.23 外 ,都 是 在 前 面 已 证 明 过 的 ， 例 2.23 也 很 容 
易 用 定理 2.1 或 2.2 解决 .甚至 用 前 面 的 解法 更 彻底 ,因为 依 定 
理 2.2, 可 知 以 上 各 例 求 出 的 UMVUE 都 唯一 ， 而 在 此 处 则 看 不 
出 唯一 性 ， 这 一 事实 其 实 是 普遍 的 ， 可 以 证 明 : 凡是 能 用 C-B 不 
等 式 法 求 得 UMVUE 的 场合 , 必 能 用 定理 2.2( 或 定理 2.1) 求 得 , 
从 这 一 点 着 , 0-R 不 等 式 作为 一 种 求 UMVUE 的 方法 , 意义 是 不 
大 的 。 但 我 们 要 注意 两 点 : 一 是 0-R 不等式 法 ， 较 基于 定理 2.2 
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的 方法 为 早 ， 二 是 0- 了 不 等 式 在 数理 统计 理论 上 还 有 些 其 他 的 
用 处 ， 以 下 要 谈 到 的 两 个 问题 可 以 归 入 这 个 范畴 ,不 过 ,在 本 教程 
中 ,我 们 没有 机 会 去 考察 这 个 不 等 式 的 多 方面 应 用 . 

1. 估计 的 效率 和 有 将 估计 为 简单 计 就 考察 9 的 估计， 涡 
(2.45)，9 的 任 一 无 偏 信 计 引 的 方差 Vare(6) 都 不 小 于 TD 


比值 


es(0) = TT /Vars(@) = InI(O)Vars(O)]™ (2.47) 
可 以 作为 6 的 方差 与 下 界 575 的 差距 的 一 种 衡量 , 称 为 无 信 


估计 有 的 效率 ， 一般 有 ei( 人 <1， 等 号 (对 一 切 仿 当 且 仅 当 有 为 
UMV UE 时 成 立 ， 当 e?(0)=1( 一 切 昌 时 , 称 6 为 有 效 估计 ， 在 
所 述 的 意义 下 , 有 效 估计 与 UMVUE 是 一 回 事 . 

这 个 概念 有 如 下 的 缺点 ; 在 一 些 情 况 下 , 没有 任何 无 偏 估计 能 
达到 C-R 不 等 式 规定 的 下 界 , 因此 ， 在 这 种 情况 下 不 存在 有 效 估 
计 ， 另 外, 0_R 不 等 式 的 成 立 有 一 定 的 条 件 . 当 这 些 条 件 不 成 立 
时 ,0-R 不 等 式 可 以 不 对 ， 这 时 ,依据 它 所 提供 的 下 限 去 定义 效率 
就 不 合理 了 ， 看 下 面 的 例子 . 


例 2.25 考察 例 3.16， 此 处 总 体 窗 度 为 九 ( 人 = 部 当 0 <t 


<0, 他 处 为 0。 注意 对 固定 的 >0, fo(t) 作 为 8 的 函数 , 在 b=t 
点 不 连续 ， 当 然 就 不 存在 偏 导数 .车 形式 地 按 公 式 计 算 ， 则 得 


91og fo(Y1)/ 90 一 一 艺 , 而 1(0) 一 1/0>，0-R 不 等 式 提供 的 下 界 
为 /mn， 但 车 到 例 2.16 中 的 无 偏 估计 全 一 全 max( 矿 ， 
五 )， 则 根据 例 2.16 中 求 得 的 的 概率 密度 ， 易 算出 


n+ mY 0 、 2 
vars (+ ?)=0 这 比 0-R 不 等 式 提供 的 下 限 02/n 
要 小 . 


鉴于 这 种 情况 ,有 的 学 者 把 效率 的 定义 作 适 当 的 修改 . 不 过 ， 
这 一 概念 总 的 说 来 在 理论 和 实际 上 的 意义 不 大 ， 故 我 们 不 多 去 讨 
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沦 它 了 . 

2. Fisher 信息 量 ” 设 总 体 分 布 有 概率 症 数 fo， 则 由 (2.46) 
式 所 定义 的 1($), 称 为 该 分 布 族 的 Fisher 信息 量 . 

这 个 概念 可 以 作 如 下 的 解释 .我 们 前 已 指出 : 在 估计 为 无 偏 
时 , 其 方差 愈 小 僵 好 .， 直观 上 这 表示 估计 值 有 更 多 地 机 会 出 现在 
9 的 附近 ， 中 要 樟 信 的 并 六 为 说 明 方 便 , 暂时 认为 C-R 不 等 
式 所 提供 的 下 限 一 产 天 py 可 以 达到 . 这 时 ,m1(9) 印 大 , 则 表示 参数 


9 可 以 估 得 愈 精 , m1(9) 与 % 和 7(0) 都 成 比例 .mn 是 样本 大 小 , 这 
意味 着 若 以 估计 量 方差 的 倒数 作为 估计 景 精度 的 指标 ， 则 精度 与 
% 成 正比 ， 比 例 因 子 , 即 IT( 外 , 反映 总 体 分 布 的 一 种 特性 。 就 是 
说 , 某 总 体 分 布 的 了 (9) 愈 大 ,意味 着 该 总 体 的 参数 愈 容易 信 计 , 或 
者 说 , 该 总 体 模 型 本 身 提供 的 信息 量 合 多。 故此 有 理由 把 I(8) 袖 
为 一 种 衡量 总 体 模型 所 含 信息 的 量 一 一 信息 量 . 区 8 也 可 以 解释 
成 单个 样本 提供 的 信息 量 。 由 于 样本 X，…，S 独立 同 分 布 , 它 
们 的 地 位 是 平等 的 , 故 每 个 样本 应 当 提 供 同 样 多 的 信息 , 即 整个 样 
本 (有 1,…, 下 ,) 所 含 信息 量 为 we.。e 的 值 是 反映 模型 “易于 认识 ” 
的 程度 .此 处 取 之 为 c=1(9) 是 从 估计 量 方差 的 角度 着 上 服 的 . 

可 以 看 这 样 一 个 例子 ， 为 估计 物 重 a, 甲 、 乙 两 人 分 别 用 两 把 
天 平 各 秤 w 次. 甲 的 天 平 较 精 , 其 每 次 秤 量 值 的 分 布 为 N(&, 1). 
乙 的 天 平 较 差 , 其 每 次 释 量 值 的 分 布 为 Y(o, 2”). 按 公 式 (2.46)， 
甲 、 乙 二 人 每 次 量 测 记 提供 的 信息 量 分 别 为 /23=1 和 1/2= 
1/4， 在 此 ,结果 是 自然 而 合理 的 ; 甲 的 天 平 较 精 , 他 秤 出 的 结 采 日 
应 包含 关于 物 重 & 的 更 多 的 信息 量 ,或 者 说 ,在 甲 的 情况 下 4 更 容 
易 佑 得 精确 些 . 

Fisher 信息 量 1(9) 的 重要 意义 在 于 ,在 点 估计 的 大 样本 理论 
的 研究 中 , 它 要 起 相当 的 作用 。 下 一 节 中 我 们 会 有 机 会 看 到 这 一 
点 , 正 是 Fisher 在 二 十 年 代 关 于 点 估计 理论 的 研究 中 定义 了 这 个 
量 , 故 后 人 称 之 为 Fisher 信息 量 。 这 个 量 与 0-RBR 不 等 式 发 生 关 
系 , 也 并 不 能 算是 一 种 巧合 。 


以 上 所 讨论 的 都 是 参数 9 为 一 维 的 情况 ， 对 高 维 的 情况 也 可 
以 建立 类 似 的 结果 ， 为 此 先 引 进 一 个 记号 , 设 4= (co) 和 了 = 
《3 是 同 阶 的 非 负 定 方 阵 . 若 4 一 B 是 非 负 定 的 ， 则 记 为 4 之 B， 

这 时 必 有 Oi Dw, 对 一 切 d, 

现 设 0 一 (901, …, 04), 总 体 概率 函数 仍 记 为 fo。， 卫 1，…, 总 为 

自 此 总 体 中 抽 得 的 简单 随机 样本 . 设 6=6(X,…，X,) = (1, 
.,， 有 D) 是 8 的 一 个 无 偏 估计 。 以 Oove( 全 记 及 的 协 方差 阵 , 它 是 
一 个 大 阶 非 负 定 方 阵 , 其 (元 为 Bo[( 名 一 900) (0; 一 9)], 则 在 类 
似 于 0 为 一 维 时 的 条 件 之 下 , 可 以 证 明 
Cove(0) > (n71(0)) 1. (2.48) 
这 里 7(9) (159)) 是 一 个 阶 正定 方 阵 , 且 
1s(0) ~ Bo Es OEE), i, j=1, eh 


《3.49) 
这 就 是 多 维 的 C- 有 不 等 式 . 由 (2.48) 知 , 若 以 (7500)) 记 工 (0 的 
道 和 矩阵 (1(9))", 则 有 
Vare@) > (0)/n, i=1, .…, £. (2.50) 
这 给 出 了 每 个 分 量 0 的 无 偏 估计 方差 的 下 限 . 
例 2.26 设 瑟 ZN oa， 0=(g, 0°) ( 即 几 一 好 
9s 一 09)， 此 处 fo(#) 一 (2m09) 1260 0/ 中 
Olog fo( 1) _。 一 由 所 Olog fo(X1) _ 一 0 
60 9 O00 


由 此 易 算 出 11(0) = 1/o%, Toa( 人 = 于 pra T1208) 一 Tai(O) 一 0， 而 


(1(9))” 的 各 元 为 T11(0)=0o?, I2s(0) 一 204, Tia(0) 一 121(0)= 
0. 因此 按 (2.50) 式 知 , a 和 的 任何 无 偏 估计 , 其 方差 分 别 不 能 
超过 ca/ 和 204/n， 前 一 个 下 限 可 以 达到 , 就 是 时 ,而 后 一 个 界 
限 无 法 达到 .事实 上 , 在 例 2.21 中 我 们 已 证 明了 后 是 ca? 的 
UMVUB.。， 利用 (w 一 53/o?~vxs-1 以 及 Var(xn-1) 二 2(m 一 1) 的 


事实 , 知 Varo(8?) 一 已->32-， 因 为 如 是 UMVUE, 不 存在 
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o” 的 无 篇 佑 计 , 其 方差 能 达到 下 限 204/%. 

由 本 例 看 出 , 即使 在 估计 正 态 总 体 方差 这 样 简 单 的 场合 , 小 及 
不 等 式 的 下 界 也 不 能 达到 . 因此 以 这 个 不 等 式 作 为 找 UMVUER 
的 方法 是 不 理想 的 .也 有 一 些 学 者 研究 改进 这 个 不 等 式 的 问题 . 

出 现在 (2.48) 式 中 的 ,由 (2.49) 定 义 的 方 阵 1(0), 称 为 Fisher 
信息 阵 . 


$2.3 点 估计 的 大 样本 理论 


关于 “大 样本 “ “小 样本 ”的 含义 ,已 在 81.4( 四 ) 中 解释 过 了 。 
按 那 里 所 阐述 的 观点 ,点 估计 的 大 样本 理论 的 对 象 , 就 是 研究 痊 样 
本 大 小 mw->co 时 ,点 估计 量 的 极限 性 质 ( 大 样本 性 质 )。 固 然 ,在任 
何 具 体 应 用 中 , 样本 大 小 m 都 是 有 限 的 . 但 是 ,如 在 8 工 .4( 四 ) 中 
所 说 明 的 ， 大 样本 性 质 对 于 衡量 一 个 统计 推断 方法 (在 此 为 点 估 
计 ) 的 优 劣 也 有 重要 意义 ,并 提供 了 一 种 近似 地 计算 其 性 能 指标 的 
方法 .对 这 后 一 点 我 们 有 必要 指出 : 目前 大 样本 理论 的 成 果 对 这 
一 目的 而 言 还 是 远 不 能 令 人 满意 的 .因为 它 未 能 给 出 当 样 本 大 小 
% 固定 时 , 种 种 有 关 的 量 的 值 与 其 极限 值 的 差别 的 有 用 估计 ， 

后 估 计 的 大 样本 理论 在 战 后 儿 十 年 来 发 展 很 快 ， 著作 文献 可 
以 说 是 汗 和 后 充 栋 .这 里 只 能 介绍 几 个 最 基本 的 概念 和 结果 . 


(一 ) 相 合 估计 

以 芷 中 记 样 本 (也 ,…，, 及 ,)，% 是 样本 大 小 ， 我 们 这 里 没有 
假定 卫 ,…， 芳 , 独立 同 分 布 ， 昌 则 这 是 最 常见 的 情况 . 设 肝 中 
的 分 布 (样本 分 布 ) 依赖 于 参数 9, 参数 空间 记 为 9,，g(0) 为 定义 在 
吕 上 的 已 知 函 数 ， 而 8 开罗 ) 为 9(9) 的 点 估计 量 ， 如 果 当 样本 大 
小 m 无 限 增加 时 , 估计 值 9( 筷 %) 在 某 种 意义 下 收敛 于 被 估计 的 值 
9g(9)， 就 称 9 和 oO) 为 g(0) 在 相应 意义 下 的 相合 估计 ， “相合 ”一 
词 可 形象 地 理解 为 9( 开 加)“ 合 ”于 g( 引 ). 

相合 性 可 以 说 是 对 估计 量 的 一 个 起 码 而 合理 的 要 求 ， 试 想 , 
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车 不 论 作 多 少 次 试验 , 也 不 能 把 9(2) 估 计 到 任意 指定 的 精确 程度 ， 
则 这 个 估计 量 是 否 合用 是 值得 怀疑 的 . 
相合 性 的 具体 意义 取决 于 收敛 的 意义 .下面 给 出 正式 的 定义 ， 
定义 2.7 如 果 当 样本 大 小 mw->co 时 ,9( 昼 中 ),1° 依 概率 收 
敛 于 g(0), 即 对 任何 6E6 及 se>>0 有 
lim Po(|g(X™)--g(0)i>8) =0, 


则 称 它 为 9(9) 的 弱 相 合 估计 ， 2° 以 概率 1 收 伍 于 g(9),， 即 了 。 
(lim 9g( 于 中 二 g(9))==1 对 任何 6E6B， 则 称 它 为 g(9) 的 强 相 合 


估计 。 3” 阶 矩 收 化 于 gC0)(7>>0), 即 对 任何 6EQ 有 
lim Bolg(X™)—g(0)|"=—0, 


则 称 它 是 %(9) 的 沁 阶 矩 相合 估计 . 当 ? 一 2 时 常 称 为 均 方 相合 估 
计 . 

根据 概率 论 关 于 这 几 种 收敛 性 的 性 质 , 一般 地 有 : 强 相合 一 弱 
相合 ; 对 任何 ”>0 有 : 7 阶 矩 相合 一 弱 相 合 ， 反 过 来 一 般 不 成 立 ， 
又 强 相合 与 7 阶 矩 相合 之 间 没 有 包含 关系 . 

现在 来 证 明 下 面 的 一 般 性 定理 ， 

定理 2.5 设 有 , …， 也 ,为 简单 随机 样本 ，gL9) 有 (2.5) 的 
形状 ，G 为 其 变 元 的 连续 函数 ， 而 9(Z) 是 短信 计 (2. 6)， 则 
9( 和 Oo) 是 9(0) 的 强 相合 估计 . 

证 ”首先 注意 下 面 的 简单 事实 : 设 fg 9) 在 (cd，…，cr) 
点 连续 ,了 mw 5 一 二 …， 一 二 2 …, 都 是 随机 变量 , 满足 条 件 : 
P (lmYu=0) = i=1,,b, 则 P Oim 成 了 oa， Yo)=™ 


fe …, 0x))=1， 根据 Kolmogorov 强大 数 律 ， 有 P(lim am= 


0) 一 1 5 一 1，…， 有 因为 mn 一 加 (一 Dear 由 (2.3) 式 及 
上 面 指出 的 事实 , 有 P(lim mm 一 jm) 一 1,h 一 1,2，…, 1， 再 利用 


证 明 开 始 处 指出 的 事实 , 以 及 G 的 连续 性 , 即 得 到 所 要 的 结果 . 
由 这 个 定理 可 得 出 一 些 常见 估计 量 的 相合 性 . 例如 , 正 态 总 
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体 N(w, o”) 中 用 样本 均值 二 和 样本 方差 82 估计 4 和 o?, 是 强 相 
合 估计 , 也 不 难 证 明 , 5? 是 os 的 均 方 相合 估计 (习题 15).， 基 实 对 
任何 +>>0, 5 是 o2 的 ”> 阶 矩 相合 估计 )。 例 2.5 中 定义 的 偏 度 、 
峰 度 和 变异 系数 , 其 怎 估 计 都 是 强 相合 估计 . 

另 一 类 重要 的 估计 是 极 大 似 然 估计 . 关于 极 大 似 然 佑 计 的 相 
合 性 问题 , 引起 了 许多 统计 学 者 的 兴趣 , 让 到 现在 都 不 能 说 已 经 彻 
底 解决 了 . 1946 年 Cramer 在 一 些 条 件 下 , 证 明了 似 然 方程 有 一 
个 根 是 参数 0 的 弱 硼 合 估计 .由 于 似 然 方 程 的 根 不 一 定 就 是 极 大 
似 然 估计 ,这 个 结果 还 没有 解决 极 大 似 然 估 计 的 相合 性 问题 . 直 
到 1949 年 ，Wald 才 首 次 证 明了 极 大 似 然 估 计 的 强 相合 性 ， 但 所 
要 求 的 条 件 很 复杂 .， 硕 后 一 些 学 者 继续 进行 研究 , 希望 在 较 少 的 
条 件 下 得 到 证 明 . 这 些 结果 我 们 都 不 可 能 在 此 细 论 , 只 打算 在 下 
一 段 叙 述 一 下 Cramer 的 结果 . 这 里 我 们 提供 一 个 反例 , 说 明 极 
大 似 然 合计 确实 可 以 不 相合 . 

例 2.27 设 总 体 分 布 为 

人 一 Dp， 当 0<p<1, 2 为 有 理 数 ; 
Po 一 1) 一 1 一 Pe 站 一 0) 一 1 一 p, 当 0<p<1, 2 为 无 理 数 . 


(2.51) 
Ab 了 , 为 抽 自 此 总 体 的 简单 随机 样本 .。 似 然 函数 为 
Pp"(1 一 p)”?, p 有 理 ; 2 
T= SX, 2.52 
{0 pe 2 无 理 . 名 ) (2.52) 


注意 到 了 /wn 为 有 理 数 , 易 见 当 2 一 也 一 了 /时 , 似 然 函数 (2.52) 达 
到 最 大 值 . 故 加 一 人 TPT/w 即 为 2 的 极 大 似 然 估计 . 但 由 总 体 分 布 
的 形式 (2.51) 知 ， 以 概率 1 软 钙 于 Pp 或 1 一 Pp, 视 p 为 有 理 数 或 
无 理 数 而 定 。 因此 , Pp 并 非 对 每 个 pE [0， 了 都 以 概率 1 收敛 于 
2, 故 不 是 2 的 相合 估计 . 


(二 相合 渐 近 正 态 估 计 (CAM 估计 ) 
定义 3.8 沿用 定义 2.7 的 记号 .车 存在 与 样本 大 小 n 有关 
的 、 定 义 于 日 上 的 阔 数 4,.(6) 和 B,(9), 其 中 B,(9) 在 8 上 处 处 大 
es BL 。 


于 0, 使 当 w~>co 时 
(8CEo) ACN /BOS NO0,1), (2.58) 
且 9( 脏 仆 ) 为 gC9) 的 弱 相 合 估 计 ， 则 称 9( 开 的 ) 为 g(0) 的 相合 渐 
近 正 杰 估 计 ， 简称 CAN 估计 (CAN 是 Oonsistent Asymptotio 
Normal 的 缩写 ). 
就 是 说 , CAN 估计 是 既 相 合 ， 其 分 布 又 渐 近 于 正 态 分 布 的 那 
种 估计 
本 段 我们 要 提出 两 个 重要 结果 , 即 在 很 一 般 的 条 件 下 ,和 矩 估 计 
为 OAN 估计 ， 而 在 较 有 限制 性 的 条 件 下 ， 似 然 方程 有 一 根 为 
OAN 估计 .这 些 定理 的 证 明 比较 复杂 , 要 用 到 较 多 的 极限 理论 知 
识 ,对 于 非 数 学 专业 的 读者 ,在 初 读 时 可 暂时 放 过 这 些 证 明 、 
1. 算 估 计 设 样本 也, …， 也 独立 同 分 布 , 待 估量 9(0) 可 
表 为 (2.5) 的 形状 .因为 中 心 矩 yw; 可 表 为 前 个 原点 和 矩 1,…， 
oi 的 多 项 式 , 故 可 以 将 9g(0) 表 为 具 依 赖 于 总 体 原 点 矩 的 形式 ， 即 
9g90)=G a, ……, ax). (2.54) 
取 矩 估计 ”、、 
9 一 9(XZ1， *%, R)— Gr, ,ny), (2.55) 
an 的 定义 如 (2.1)， 再 设 总 体 的 2 阶 原点 矩 存在 且 G 对 各 变 元 
有 一 阶 连续 偏 导数 . 令 
0 二 4 一 050y,， 5 j 了 二 1，…, ;B= 二 《bwy).(E 阶 方 阵 ) 


(2.56) 

ou 一 8G(o ,ox)/O0, Ss=1, (人 dy). 
(2.57) 
b’ = dBd. (2.58) 


定理 2.6 在 上 述 条 件 和 记号 下 , 当 w>oo 时 有 
Vn (GF, 0 Bs) G 0, 0, 08)) > N CO, 5°). 
(2.59) 
证 “我们 先 把 证 明 所 需 的 预备 事实 开 列 如 下 。 这 些 事实 都 可 
以 在 一 般 的 概率 论 教 本 中 找到 ， 或 者 可 以 由 熟知 的 概率 论 结 果 容 
易 地 推出 来 / 
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8. (多 维 中 心 极限 定理 ) 设 了 了 1, 了 。，… 为 一 串 独 立 同 分 布 
的 维 随机 向 量 ，BYj=0 而 Cov( 了 =4， 则 当 no0 时 ， 


了 (Yt…+ 了 ,) 依 分 布 收敛 于 亡 维 正 态 分 布 轧 (0, 4). 
b. 车 当 NOO 时 ， CY ,1 **"y 了 ww) 依 分 布 收敛 于 k 维 正 态 分 
布 N(O, 4), 而 ou ***, CE 都 是 常数 ， 则 当 "一 co 时 ， Zar 依 分 
布 收 全 于 一 维 正 态 入 (0, eo' 入 e), 其 中 oc 一 (64, …*, Cx). 
9。 车 随机 变量 了 ， 依 分 布 收 敛 于 分 布 忆 ， 而 2 依 概率 收敛 
于 0, 则 了 .十 2 依 分布 收 敛 于 卫 . 
d. 若 当 %~>o0 时 , 维 随机 向 量 ( 了 wz, …， 了 wx) 依 分 布 收 化 
(于 某 一 分 布 )， 而 ni, Zna, ”7 OA 都 依 概 率 收 敛 于 0, 则 当 ”一 
co 时 训 Zn 依 概率 收敛 于 0. 
转 到 定理 的 证 明 . 有 
g—G(ou, “+ Op) -> Os (gm— on) + Em( Wm — O61) 
此 处 sm= OG(t, 四 ty ) /Obi | pm 2 一 工 ， “°°, Ek, 而 Pn 是 以 
(oa， “°° oz) 和 (eni， ”5 co) 为 端点 的 线段 内 的 基 一 所 .因为 an 
为 os 的 相合 估计 ， 且 G 的 偏 导数 在 (oa， 机 oyx) 点 连续 ， 有 
8 三 0 当 m yco $=1, 大 (2.60) 
知 记 P= (Qi 发 一 aa， ”1 ?YO— oy), 2 一 十 ， 2, oy 则 Y,, 
了 3,… 独 立 同 分 布 , 且 B71 一 0, Cov( 了 i) 一 B(B 见 (2.56) 式 ). 故 
依 预 备 事实 < 有 二 一 襄 也 (0，B)， 但 易 见 一 襄 Y~ 
Vn (om 一 ad; “°° am 一 ox), 故 得 


VR a0, 1 Gop — om) > NO, B). (2.61) 
这 与 预备 事实 5 结合 , 即 得 
Vn da 一 oa S$ NCO, 56°). (2.62) 


中 见 (2.58)。 由 (2.60), (2.61), 及 预备 事实 4 知 


-一 Ek P 
Vn 这 Bin (Unt — 0 ) 一 > 0. (2.63) 


把 (2.62) 与 (2.63) 结 合 , 并 利用 预备 事实 CO, 即 得 (2.59). 定理 证 
毕 . 

在 不 少 情况 下 , 要 估计 的 9(2) 可 表 为 一 、 两 个 中 心 矩 的 函数 ， 
比较 简便 ,而 要 通过 原点 矩 表 出 则 很 复杂 .因此 ,有 必要 给 出 在 这 
种 情况 下 的 渐 近 正 态 性 结果 .一般 地 ,我们 来 考察 形 如 

g(0)= Hl@, Wr, **, Wt), (2.64) 
其 矩 估计 景 为 五 ( 汪 。 nano， …，oat)。 使 用 与 定理 2.6 的 证 明基 
本 上 相同 的 方法 , 但 稍微 复杂 一 些 ( 复 杂 之 处 在 于 , 中 心 矩 不 是 独 
立 同 分 布 变 量 和 ), 可 以 证 明 下 面 的 结果 . 

定理 2%.6” 设 (2.64) 式 中 的 函数 五 在 (oi, jw …, 6 点 的 
邻 域内 有 一 阶 偏 导数 ， 和 且 此 等 偏 导 数 在 点 (oa, J, …， ks) 处 连 
续 . 则 有 

Vn {HCY,, Wontsy “*"}, Tinta) —H(o, Htss ***) Wi)} 


S NWN(0, 52). (2.65) 
此 处 | 
0 => > oyHiH;. (2.66) 
t=1 了 一 十 
其 中 万 -2 万 =-2 -2 .ci 
Oo 加 Li， 


CH 一 及 3，GH 一 G 计 一 有 tt 一 不 Nt HU 2 一 2 0 
OW= Wrts — bets 1Mis+1— bss 41Wts—1 
一 ts tttmats -Mt 1 %, j=—2, ***, C. (2.67) 
如 果 g(9) 有 及 (jrs,*…，jt,) 的 形状 ， 即 与 oa 无 关 ， 则 (2.65) 式 
当然 仍 成 立 , 只 人 须 把 (2.66) 式 所 确定 的 外 修 改 为 D422 Za at 
五 ; 互 y 即 可 . 
例 2.28 考察 例 2.5. 被 估计 的 量 gC(9) 为 偏 度 Gil、 峰 度 BB。 
及 变 蜡 系数 广 ， 其 矩 估计 分 别 为 
B=— mrs/ ms, Bs=— ma/ mis, P= mna/ 尽 ，. 
按 (2.66)、(2.67) 式 ,对 这 三 个 情况 分 别 算 得 妨 值 为 ， 
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53(B1) ~6, BBs)—24, VV) V+. 
于 是 据 定理 2.6 有 
V(b BS NGO, 6), 
Vn (Ba Ba) > NCO, 24), 
Vi(P -VS NC, V+y). (2.68) 


值得 注意 的 是 , B1. Bo 的 极限 分 布 方差 已 与 被 信 计 的 参数 值 无 关 ， 
这 一 点 对 B1、Bs 的 大 样本 推断 有 用 . 

2. 极 大 似 然 估计 “我们 只 考虑 参数 9 为 一 维 的 情况 . 设 总 
体 有 概率 函数 f,《w)， 为 确定 计 , 就 设 它 是 概率 密度 .， 设 参数 空间 
@ 为 一 开 区 间 (a, 8)。 假 定 fo 满足 以 下 各 条 件 : 

1° 设 总 体 为 m 维 ， 在 BE" 中 存在 子 集 作 ,使 对 一 切 8€8， 
有 fo(2)>>0 当 wE2, fo(r)—=0 当 vwER. 

2° 当 zE2 时 ,有 (x) 对 9 的 前 三 阶 导 数 在 B98 上 处 处 存在 ， 且 
存在 定义 于 入 上 的 函数 Pi(z)，Fa(z) 和 互 (z)， 使 对 一 切 6EG@ 
和 zE2, 有 

[8@fo (2) /600| <F (x), |0fo(2) /8600 | F(z), 


12 log fo(z2)/80°| < H(z%), (2.69) 
其 中 
| Fe)az<co， i—1, 2 | CoD7eo) dz<co, EQ. 
(2.70) 


3” 对 一 切 89EB 有 
0<7(0)= | (B10g fo(2)/09):fo(w) do <o0. (2.71) 


定理 2.7 设 人 1,…, 他 ,为 取 自 满足 上 述 条 件 1° ~3° 的 总 
体 的 简单 随机 样本 , 且 设 对 数 似 然 方程 


p32 fo Xi) /00=0 (2.72) 
有 唯一 根 6 二 6( 玉 1,…, 下 ,), 则 6 是 9 的 OAN 估计 , 且 


Vn (8-0 N (0, Tm) pce. (2.73) 

证 整个 证 明 分 两 步 ， 第 一 步 证 明 6 相 合 , 第 二 步 证 明 
(2.78), 

设 9 的 真 值 为 60， 以 Li f(x). 把 9log fel 革 ,)/80 作 


为 和 的 函数 ,在 2 点 作 Taylor 展开 ,有 
Olog fo(X,)_ Ologfo(Ks) 
00 20 


980 
2 
+ 0-600) 9908 fa x 


+ 要 (6-go02 瑟 (X9). 
此 处 pi 为 某 一 介 于 0, 1 之 间 的 量 . 将 上 式 对 5 一 1 …, m% 相 加 ， 
可 将 似 然 方 程 (2.72) 写 为 : 
pL DlgE Bt A000 + p00 


(2.74) 
此 处 
Bo=~l S01logfo(X) BL Balog fo( 玉 0) 
9 A Od 9=003 nn 00” 800 
Bs— L3H(R), (2.75) 
#4=1 


而 0<p<1、 注 意 9 与 wm 一样 ,与 如 .9 和 样本 下 1，…, 下, 都 有 
关 . 
注意 Bo、 Bi、Bs 都 是 m 个 独立 同 分 布 变量 的 算术 平均 。 现 往 
证 其 均值 都 存在 , 且 
BBo—0, BBi= I1(00), BBs=| Hs) fo.(w) do bs. 
. (2.76) 
最 后 一 式 由 (2.70) 立 即 得 出 , 且 0< 如 <oo， 为 证 前 两 式 ， 注 意 由 
(2.69) 和 (2.70) 知 ,| 记 (z)dz( 其 什 为 人 可 在 积分 号 下 对 0 两 次 
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| (ay oe(w) / 00) | 0-0o dz -| Cey 6 (%)/ 202 ) | e-eud0 一 0. 
C2.77) 
由 (2.77) 得 ,Bo -| (afol%) /80) 1o_o, dz 一 0， 又 
po -| (2: log fo (2) /80°) | sa 


和 | Cj (2)/00°) |e-osdz 
一 1 efo (2) TI Or 
| 天 Co ”下 ) fo, Co)d 
一 - | log js(z)/a6)ae-o fav) dr = —1(00), 


现任 给 s>0， 取 3i>0 充 分 小 , 其 具体 值 待定 .由 于 0<I(0o) 
<<co,，0 委 <<co, 据 大 数 定律 ， 可 找到 只 与 es 和 561 有 关 的 自然 数 
No, 使 当 n> no 时 ， 有 


8=00 


Po= Po,(|Bo| >61) < 天 去， z (2.78) 

一 Po( Bi> 一 半 I(00))< 世 ， (2.79) 

2a 一 卫 。， (Bs> ba 1) < 可. (2.80) 
因此 ,车 定义 事件 | 


B-—{|Bl <81, Bi < -去 I(0o), 0<Bs< bat1l, 
则 当 mw>mw 时 ,有 Po(B)>1T 一 s。 
现 考虑 (2.74) 中 的 及 (9)。 当 事件 B 发 生 时 ,有 
h(0o -6)> 一 8 二 I(00)8— (ba+1)83, 
h(Oo+ 6) <5: 一 去 ITgo)3+ (5 二 16， 


对 任意 8>0. 现 取 人 =, 并 取 5, 使 
0<8<1(00)/(bs+ 2), 


则 及 (0-8)>>0>h(9o+8)， 由 条件 1*、2° 推 知 ， 方 (0 一 
二 0 -一 光一 -是 0 的 连续 函数 , 故 在 区 间 (bo 一 5,， po 二 3) 内 ,有 似 然 方 


总 的 根 、 但 据 假 定 , 似 然 方 程 只 有 唯一 根 ,因此 , 这 个 根 就 是 6， 这 
样 ,我 们 证 明了 ; 当 事 件 吾 发 生 时 , 有 16- go| 过 5， 故 当 n 之 no 时， 
有 Ps,(10--bo|>8)=1- Po(16-bo 和 5)<1 一 Po(B)<s. 因为 
s>0 和 8>0 都 可 以 给 得 任意 小 , 证 明了 人 -ay 9。, 即 6 为 9 的 相 
合 估 计 . 

现 转向 证 明 (2.78)， 用 (2. 4) 式 , 注 h(6)=0, 有 

Vw (6—0o) —VRB/(- B,—.-1 Bs(O— 00)"). 

z (2.81) 

适 已 证 明 6_0 as 0, 又 jp| 志 1 而 Po,(Bs—>bs) 一 1 帮 一 车 wp Bs 
(6--90)? 一 >0， 因 为 B1 一 %*> 一 (90), 故 知 当 w->co 时 ,有 


(2.81) 右边 的 分 母 二 wy IC60). 
由 此 可 知 , 当 VR (6-9。) 的 极限 分 布 , 与 


1 Olog fo(X1) 
V ® Bo/1(00)— -元 裤 了 GT IT(0o) 人 


如 一 Do 


(2.82) 
的 极限 分 布 相同 。 但 (2.82) 右 边 和 号 下 的 ww 项 独立 同 分 布 , 各 有 
均值 0 及 方差 
alog ye ) -1 
Fr | (Ge - ) ja)| oo I(0)° 


于 是 由 独立 同 分 布 变量 和 的 中 心 极限 定理 知 当 > 时, (2.82) 
依 分 布 收敛 于 (0，-7C7T )， 如 上 所 述 ,这 就 证 明了 (3.73)、 定 
理 证 毕 . 


(三 ) 最 优 渐 近 正 态 估计 (RAM 估计 ) 和 渐 近 效率 
一 个 参数 的 CAN 估计 一 般 有 很 多 。 拿 正 态 总 体 W (cc，c9) 中 
ee 83。 


c 的 估计 来 说 , 样本 均值 和 样本 中 位 数 都 是 CAN 估计 ， 因 此 , 就 
存在 一 个 比较 优 劣 的 问题 . 
设 针 一 (及 1 …， 于 。), 5 一 1 2, 是 9(0) 的 两 个 OAN 估计 ， 
并 假定 具体 地 有 
Vn (G90)) 3S NCO, of(0)), 9€0, i~1, 2, (2.83) 
而 03(0) 二 o300), 则 我 们 认为 条 优 于 9s。， 这 可 以 作 如 下 的 解释 
任 给 e>0， 问 “ 仿 与 0) 的 偏差 不 超过 o/ wm” 的 概率 有 多 大 ? 依 
(2.83), 近似 地 有 
TAI) 


Po(19 一 g(0) | <0/ Vn ) 忆 一 让 一 -二 | 


由 此 可 知 , 车 o1(0) 达 oa(9), 则 当 %% 充 分 大 时 , 有 Po(191 一 g(0)| 
<eo/ ww )>Po( 访 -9(9) |<oc/V nm), 对 任何 c>>0, 就 是 说 ， 当 
样本 大 小 到 足够 大 时 ,使 用 和 去 估计 9(9)， 较 之 使 用 9s, 更 有 可 
能 得 到 较 准 确 的 估计 ， 正 是 在 这 个 意义 上 , 我 们 说 沪 优 于 0a. 

(2.83) 式 中 的 o2(9) 称 为 估计 量 9; 的 渐 近 方差 . 渐 近 方差 只 
可 以 理解 为 极限 分 布 的 方差 ,而 不 能 理解 为 nVars(9i) 的 极限 ， 实 
际 上 ， 即 使 有 (2.838), 9; 可 以 根本 没有 方差 (甚至 也 可 以 没有 均 
值 )， 使 用 这 个 术语 ,可 以 说 : 两 个 GAN 估计 渐 近 方差 小 的 好 ， 这 
与 在 样本 大 小 固定 时 ,两 个 无 偏 估 计 , 方 差 小 的 好 相似. 

于 是 自然 地 就 产生 找 渐 近 方差 最 小 的 OAN 估计 的 问题 ， 这 
种 估计 称 为 最 优 渐 近 正 态 估计 , 简称 BAN 估计 (BAN 是 Best 
Asymptotie Normal 的 缩写 ) 。 这 里 可 以 把 问题 分 两 步 提 ; 

1. 找 一 切 CAN 估计 的 渐 近 方差 的 下 确 界 . 

2. 找 出 其 渐 近 方差 达到 这 个 下 确 界 的 QAN 估计 ， 也 就 是 
BAN 估计 . 

关于 第 一 个 问题 ， 早 在 Fisher 就 猜测 ， 这 个 下 确 界 就 是 
Fisher 信息 量 的 倒数 1/1(0)。，Fisher 是 从 他 对 极 大 似 然 估计 的 
研究 作出 这 一 猜测 的 ( 极 大 似 然 估计 是 最 好 的 估计 , 其 渐 近 方差 应 
是 最 小 的 )。 现在 我 们 从 C-R 不 等 式 的 角度 观察 , 也 觉得 这 个 狂 
测 是 可 信 的 ， 然 而 在 五 十 年 代 ，Hodges 举 了 一 个 反例 , 证 明 即 使 
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在 入 (9, 1) 这 样 简单 的 情况 , 也 可 以 作出 9 的 CAN 估计 ， 其 渐 近 
方差 在 指定 的 8 值 处 为 0。 这 一 来 就 打破 了 这 个 猜测 ， 这 个 事实 
引起 了 一 些 学 者 的 兴趣 。 经 过 一 些 学 者 的 研究 ,证 明了 Fisher 的 
猜测 ， 在 一 定 限制 性 的 意义 下 是 对 的 (具体 地 说 ， 要 排除 某 些 象 
Hodges 例子 中 那 种 “病态 性 的 "CAN 估计 , 只 对 剩 下 的 CAN 估计 
求 渐 近 方差 下 界 ) 。 这些 研究 都 过 于 专门 ,不宜 在 此 叙述 . 

这 样 , 在 一 定 意义 下 可 以 把 BAN 估计 定义 为 “其 渐 近 方差 等 
于 1/I(9) 的 CAN 估计 ”， 据 此 ， 再 结合 定理 2.7, 就 得 到 极 大 似 
然 估计 的 一 个 重要 性 质 : 在 一 定 条 件 下 , 若 似 然 方程 的 解 唯一 , 且 
这 个 解 8 是 极 大 似 然 估计 , 则 6 是 BAN 估计 . 

也 可 以 用 另外 的 方式 来 表达 这 个 结果 ， 为 此 ， 引 进 “ 渐 近 效 
率 ” 的 概念 ， 设 六 为 g(b) 之 一 GAN 估计 ， 其 渐 近 方差 为 ca2(0)， 
则 称 


a00(0) =— Tipy /0) (10)o(0) + (2.84) 


为 9 (在 9 点) 的 渐 近 效率 ， 据 此 , 极 大 似 然 估计 有 渐 近 效率 1. 至 
于 和 矩 估计 ,我 们 前 已 证 明 它们 在 很 一 般 的 条 件 下 为 GAN 估计 . 不 
过 ， 除 了 儿 个 常见 的 例子 (在 其 中 矩 估计 与 极 大 似 然 估计 重合 ) 之 
外 ， 矩 估计 的 渐 近 效率 一 般 都 远 低 于 1， 通常 人 们 说 算 估 计 不 如 
极 大 似 然 估计 , 大抵 就 是 指 这 一 点 而 言 。 

最 后 再 举 两 个 确定 渐 近 效率 的 例子 ， 

例 2.29 设 卫 !，…, 了 (ca o)， 要 估计 4， 以 9 记 样 
本 中 位 数 ， 据 民 .38) 式 ， 并 注意 到 在 此 处 有 f(&y)=f(@) 一 


1 
J 有 


/mt (bh_mnSNo,1 
ON on /30 (g o> 《0， )， 


或 写 为 Vn(G-o) 3?N(0, 至 oa)， 


渐 近 方 莽 为 亚 o?。 在 此 处 有 了 (9) =- 方 , 故 按 (2.84) 式 有 


Cr2 
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aes(0) =—2/n. (2.85) 
(2.85) 大 体 上 可 解释 为 ; 当 很 大 时 ,用 nw 个 样本 的 样本 中 位 数 去 
估计 总 体 均 值 w 相当 于 用 2n/z 个 祥 本 的 样本 均值 去 估计 wa。 

例 2.30 设 玉 1, … ,了 ,为 抽 自 Qauchy 分 布 (密度 丈 数 为 
[rz(1 十 (z- 9)?)] -的 简单 随机 样本 ， 要 估计 s， 仍 以 9 记 样 本 
中 位 数 , 与 例 2.29 同样 的 方法 证 明 , 渐 近 效 率 为 8/m2( 习 题 17)。 


习题 

1， 严格 证 明 (2.19) 是 NCa, 0) 的 参数 (a, c9) 的 MLE 

2. 车 下 =ef 而 ~N(a,o), 则 X 的 分 布 称 为 对 数 正 态 分 布 ， 求 出 的 
密度 ， 设 卫 ，…, ZX。 是 X 的 简单 随机 样本 , 求 a。 和 0? 的 矩 和 极 大 似 然 估计 ， 

3， 荐 存在 充分 统计 量 , 且 样 本 民有 概率 函数 , 则 MLB 是 充分 统计 量 的 
函数 

4. 设 总 体 密度 为 exp( 一 12-4|/o), o>0 和 a 为 未 知 参数 ， 设 
XZ，…,， XX 为 抽 自 此 总 体 的 简单 随机 样本 ， 求 4 和 o 的 矩 及 极 大 似 然 人 
计 . 

5， 设 Xu ,Xs 为 抽 自 密度 是 圭 o 人 ”的 总 体 的 简单 随机 样本 ,Xs 
<Xw<XXs 为 次 序 统计 量 , 则 Zw 是 9 的 MLE， 就 本 例证 明 : MLE 不 一 定 
是 充分 统计 量 (提示 : 用 因子 分 解 定理 ,证 明 不 存在 函数 g(Xw，9) 和 (ZXy 
Zs, Xo), 使 于 exP( 一 社 1 了 一 01 )=9CXews 0)hCXs， Xs， Xs), 也 可 以 直接 
由 充分 统计 量 定义 证 ; 证 明 在 给 定 Xew 时 , Xay 的 条 件 分 布 与 9 有 关 )， 

6， 设 Xu …,X 为 从 具有 指数 分 布 (1.8) 的 总 体 中 抽出 的 简单 随机 样 
本 。 已 知 卫 为 均 的 无 偏 估计 ， 弄 清 , 1/ 驻 是否 为 》 的 无 偏 估 计 . 

7. 设 KK，…，Xs~NW C6, 了， 证明: 9C9) = 19| 没 有 无 偏 估计 (提示 : 利 
用 g(6) 在 0=0 处 不 可 导 ). 

8. 设 Xi …， 和 是 从 具 Poisson 分 布 (23.77 中 抽出 的 简单 随机 桩 本. 
(0) 求 e-*” 的 UMVUB， 说 明 这 个 估计 不 合理 之 处 ， 给 出 一 个 看 上 去 “合理 
的 估计 . (b) 要 gC9) (定义 于 0<9<e) 的 无 偏 估计 存在 ， 充 要 条 件 是 什么 ? 
求 出 9(9) 的 UMVUE( 提 示 ， 若 9(0) 的 无 偏 估计 存在 ， 则 必 存 在 只 依赖 于 
7 一 六 工 的 无 偏 估计 ， 写 出 gb) 一 Bo 《T) 一 局 o” -下 (六 ， 由 此 证 
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明 充 要 条 件 为 :9(6) 可 展开 为 客 级 数 , 收敛 半径 为 ce. 比较 系数 得 UMVU 卫 ). 

9. 证 明定 理 2.1 之 道成 立 ; 若 9 为 g( 的 的 CUMVU 也 Vare(9<co 对 任 
何 0€ 日 ， 则 当 Bo==0 且 Vars( 站 < 对 一 切 06@ 成 立时 , 必 有 Cova(9, 了 》 
一 0 对 一 切 ge @( 提 示 : 用 反 证 法 .车 Cove(9, 门 0 对 基 个 ge@ 则 存在 
常数 6，|6| 充 分 小 , 使 Vare(9 十 60) <Vare(9)， 因 为 9+6i 为 无 偏 估计 ,得 
到 浮 盾 ). 

”10. 求 以 下 各 情况 下 的 UMVUE. (a) XZy, …, X»~B(n, p),g(p) =p?. 
(EI, 1 Ka BOO, 0), gO) = Vare XD). (OK, *…, Kn~N(a, o), 
0={4, o), 90) =ao. | 

11, 设 了 Zi … ,Ev 和 N(0, 1)， 求 人 的 UMVUB. 证 了 明 : 此 UMVUE 
达 不 到 0-R 不 等 式 的 下 界 . 

12. 设 Xu Xn 和 ~ 和 (a oa 了 i， …， Yn~N(4, 03), 各 样本 Xi …， 
入 ww Ti …; Yn 独立 。，(a) 设 3=poi 而 p>0 已 知 证 明 : a 的 UMVUE 
存在 ， 求 出 它 。 (b) 证 明 当 。 未知 ( 即 p 也 是 参数 ) 时 , 4 的 UMVYUE 不 存在 
(提示: (a) 中 求 得 的 UMVUE 唯一 旦 与 p 有关 .同时 , (a) 中 求 得 的 UMVUE 
即使 当 p 未 知 时 也 是 4 的 无 偏 估 计 ). 

13. 设 已 ，…， 忆 一 下 (0 作 ,9>0, 6 为 6 的 MLE， 证 明 ; ;是 8 的 
强 相合 估计 及 任意 阶 的 矩 相合 估计 (提示 : 证 强 相合 时 要 用 到 Borel-Cantelli 


引 理 证 明 对 任 给 s>0 有 习 PC 下 1>e) 一 co) 


14. 设 入 ,…， Xs 是 从 一 总 体 中 抽出 的 简单 随机 样本 , 以 9 记 总 体 中 位 
数 .(a) 利 用 (1.38) 式 证 明 : 车 总 体 有 密度 函数 了, 在 9 点 大 于 0 且 连 续 , 则 
样本 中 位 数 mw。 是 的 弱 相 合 估计 .Cb) 利 用 强大 数 定律 证 明 更 强 的 结果 : 若 
总 体 分 布 只 有 唯一 的 中 位 数 9, 则 wo 是 9 的 强 相合 估计 (提示 : 由 9 唯一 知 ， 
对 任 给 6>0 有 了 (9 一 OV2<PO+), 下 为 总 体 分 布 函数 ， 由 强大 数 律 ， 
以 概率 1 成 立 { 当 w 充分 大 时 ，，…， 及 中 小 于 9 一 和 者 少 于 /2 个 ， 大 于 
6 二 省 也 少 了 ?1/2 个 } 因此 , 以 概率 1 成 立 : 当 % 充 分 大 时 有 |mn 一 9]<8). 

. 设 ,Xn~N(a, ca2)，82 为 样本 方差 证 明 5? 是 c2 的 均 方 

ey 

16. 扩 是 9 的 均 方 相合 估计 的 充 要 条 件 为 : 四 渐 近 无 偏 ， 且 lim Var 
(6,) =0, 对 任何 9€ @. 

17. 证 明 例 3.30 的 结果 . 

18. 设 Xl， … na~NW(4, 0?)， 在 第 一 章 (1.40) 式 中 曾 定义 过 o 的 估 
计 景 &. 证 明 (Ca)a 非 o 的 无 偏 估计 ,但 为 浙 近 天 偏 ，(b) 修 改 4 以 得 到 o 的 
无 偏 估计 GQ*.， (6) 计算 a* 的 方 关 ， 因而 证 明 4* 为 均 方 相合 .〈d) 证 胃 噬 是 


* 0 ， 


c 的 强 相合 估计 (提示 : 验证 和 ,- 斑 ~R(0，(1- 寺 )o2) 由 此 不 难 算出 
(2)， 为 算 VarCa*)， 要 计算 BCXs- 叉 ) (Xi 一 六 1， 一 7 时 容易 ?和 
时 ， 先 验证 (X, 一 了 已 一 部 ) 为 二 维 正 态 W(o 0, (1 二)co (1 二)o5 
二 )， 为 证 (a), 要 利用 强大 数 律 , 并 利用 估计 式 
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第 三 章 假设 检验 
§3.1 概述 Pearson 和 Fisher 的 思想 


(一 ) 引 言 

考察 下 面 的 简单 例子 ， 

例 83. 有 一 大 批 产 品 要 由 工厂 卖 给 商店 ， 该 批 产品 的 度 品 
率 wp 未 知 ， 工 厂 与 商店 协商 了 一 个 数字 p', 例如 和 一 0.02, 约定 当 
2<2 时 ,商店 接受 这 批 产 品 , 否则 就 拒 收 ， 由 于 pp 未 知 ( 且 假定 不 
可 能 进行 全 面 检验 以 决定 2)， 无 法 确切 地 知道 是 否 该 接受 ， 于 是 
双方 同意 用 抽样 检验 的 方法 ， 从 该 批 产 品 中 随机 地 抽出 % 个， 以 
下 记 其 中 废品 个 数 , 根据 总 的 值 , 用 某 种 双方 同意 的 规则 , 去 决 
定 商 店 是 否 接受 该 批 产 品 . 

设 % 与 整 批 产品 个 数 相 比 很 小 ， 于 是 可 足够 准确 地 假定 王 
服从 二 项 分 布 B(n, p)， 这 样 ， 可 以 把 上 述 纯 由 实用 产生 的 问题 
归结 为 一 个 理论 问题 ， 样 本 卫 ~~B(n, 2) 要 根据 了 的 观察 值 ， 
对 命题 互 :w<p 作出 “是 ”或 “ 否 ”" 的 判断 ， 在 统计 术语 中 , 把 这 种 
需要 根据 样本 去 推断 其 正确 与 否 的 命题 ， 称 为 一 个 假设 或 统计 假 
设 . 通过 样本 以 对 一 个 假设 作出 “是 ?或 “ 否 ” 的 判断 的 程序 ， 称 为 
检验 这 个 假设 , 具体 的 判断 规则 称 为 该 假设 的 一 个 检验 ， 检验 的 
结果 车 是 肯定 该 命题 , 则 称 接受 这 个 段 设 。 其 反面 则 是 否定 或 拒 
绝 这 个 假设 .注意 此 外 的 “接受 ”和 “否定 "这 种 用 语 ， 它 反映 当 事 
者 在 扩 面 对 的 样本 证 据 之 下 ， 对 该 命题 所 采取 的 一 种 态度 、 倾 向 
性 , 以 至 某 种 必须 或 自愿 采取 的 行动 , 而 不 是 在 逻辑 上 “证 明 ” 了 该 
命题 正确 或 不 正确 ， 这 自然 是 因为 样本 有 随机 性 .比方 说 ， 从 一 
批 废品 率 很 小 的 产品 抽出 的 样本 中 ， 也 可 能 碰巧 包含 了 较 多 的 废 
总, 而 导致 该 批 产 品 被 拒 收 ， 

中 


实用 问题 化 为 统计 假设 检验 问题 去 处 理 ， 一 般 都 与 上 述 例子 
类 似 , 可 以 概括 为 以 下 几 条 . 

1. 明确 所 要 处 理 的 问题 ， 问 题 的 回答 只 能 是 “是 ”或 “ 否 ”. 如 
例 3.1 “是 "就 是 “这 批 产 品 应 予 嫉 受 ” 

2. 设计 适当 的 观察 或 试验 以 取得 样本 互 , 碟 的 概率 分 布 
( 常 是 通过 这 分 布 的 参数 或 数字 特征 ， 如 上 例 的 p) 必 须 与 间 题 有 
一 种 确定 的 联系 ， 确 切 电 说 : 知道 了 对 的 分 布 (或 其 参数 .数字 特 
征 ), 就 能 明确 无 误 地 回答 所 提 亲 题 . 

3. 把 问题 的 一 种 回答 , 例如 “是 ”， 作 为 一 个 命题 . 这 个 命题 
转化 到 翌 本 于 的 分 布 上 , 就 得 到 关于 后 者 (或 其 参数 、 数 字 特 征 ) 
的 一 个 等 价 命题 , 称 为 一 个 假设 . 

4. 根据 样本 邓 的 具体 值 ,按照 一 定 的 规则 , 作出 接受 或 否定 
假设 的 决定 ， 回 到 原 问 题 ,就 等 于 回答 为 “是 ”或 “ 否 ” 

假设 检验 是 一 种 有 重要 应 用 价值 的 统计 推断 形式 . 从 理论 上 
说 , 它 是 数理 统计 学 的 一 个 重要 分 支 。 除去 某 些 早期 的 片段 情况 
不 计 , 可 以 明确 地 说 , 假设 检验 方法 和 理论 的 系统 发 展 , 始 于 本 世 
纪 初 . 大 致 上 按照 时 间 顺 序 , 其 过 程 经 历 了 以 下 一 些 重大 事件 : 

”(1) 区 , Pearson 的 拟 合 优 庆 Xe 检验 (1900 年 ); 

(2) R. A. Fisher 的 显著 性 检验 (本 进 纪 二 十 年 代 ) 

(3) J. Neyman 利 卫 . S，Pearson 的 理论 (1928 年 开始 ); 

(4) A. Wald 的 统计 判决 理论 (1950 年 ); 

(5) Bayes 方法 ， 其 中 ,Bayes 方法 的 确切 年 代 不 好 定 : 这 方 
法 的 基本 观点 可 追溯 到 工 . Bayes(1702~ 人 1761)。 本 世纪 早期 已 
有 不 少 学 者 鼓吹 ,但 成 为 一 种 有 影响 的 方法 还 要 算 在 鼓 后 . 上 述 
4.5 两 项 将 在 第 五 章 中 讨论 ,本 章 只 涉及 前 三 个 题目 . 

Neyman-Pearson 关于 假设 检验 的 理论 (NP 理论 )， 是 建立 
在 概率 的 频率 解释 基础 上 的 、 关 于 假设 检验 的 一 套 形式 比较 完美 
的 数学 理论 , 通过 适当 的 表述 方式 , 可 以 把 Pearson 和 Hisher 的 
工作 包括 到 这 个 理论 中 去 讨论 。 这 样 做 在 数学 上 较 易 处 理 , 并 为 
一 些 统计 著作 所 采用 ， 但 作为 一 个 初次 接触 假设 检验 这 个 题目 的 
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读者 来 说 ,很 有 必要 了 解 一 下 Pearson 和 Fisher 这 些 大 师 的 思想 ， 
因为 他 们 是 从 很 实际 的 角度 出 发 来 考虑 问题 ， 通 过 对 他 们 的 工作 
的 学 习 , 对 假设 检验 中 一 些 基 本 概念 的 理解 很 有 帮助 , 而 这 些 正 是 
初学 者 容易 忽视 的 地 方 . 从 历史 的 角度 说 ,NP 理论 也 不 能 算是 另 
起 炉灶 , 而 是 对 他 们 的 工作 的 继承 和 发 展 ， 以 还 之 故 ,在 这 引 论 性 
的 一 节 中 ,对 Pearson 和 了 isher 的 观点 作 些 介绍 是 有 益 的 . 


(二 ) Pearson 的 思想 ， 拟 合 优 度 检验 

1938 年 ,KK. Pearson 的 儿子 、 本 身 也 是 著名 统计 学 家 的 卫 . 及 . 
Pearson， 曾 在 一 本 关于 他 父亲 的 生平 和 工作 的 著作 中 ， 提 到 开 ， 
Pearson 对 统计 的 任务 的 看 法 是 “To prediot from past what will 
bappen in the future”( 从 以 往 去 预测 将 来 会 发 生 什 么 )， 以 
及 在 十 九 至 二 十 世纪 之 交 统计 当务之急 是 “What was needed was 
a method for iranslating observed data into a predicative 
model “(需要 的 是 一 种 方法 ， 以 将 观察 数据 转化 为 一 个 可 用 于 预 
测 的 模型 )。 Pearson 所 谓 “ 过 去 ”， 就 是 指 已 有 的 观察 数据 , “将 
来 " 则 是 指示 来 观察 的 可 能 结果 ， 要 做 到 由 过 去 顶 测 未 来 , 必须 用 
一 个 统计 模型 , 确切 地 说 就 是 一 条 分 布 密度) 曲线, 去 拟 合 已 有 的 
数据 . 然后 用 拟 合 的 分 布 去 计算 在 炒 来 的 观察 中 , 出 现 种 种 值 的 
可 能 性 大 小 ， 为 此 Pearson 提出 了 后 来 以 他 的 名 字 命 名 的 曲线 
系 , 希望 在 这 个 系统 中 , 找 出 一 条 曲线 , 与 已 有 的 观测 数据 去 进行 
拟 合 、 在 此 需要 处 理 以 下 两 个 问题 ,1. 从 曲线 系 中 怎样 去 确定 一 
条 . 2. 估量 拟 合 的 程度 如 何 . 为 解决 第 一 个 问题 引出 了 他 的 矩 
估计 法 .关于 第 二 个 问题 . Pearson 引进 了 一 个 统计 量 一 一 x?* 统计 
基 〈 详 见 § 3.2)k 一 hb( 及 ;1, i F), 以 反映 数据 三 1，*…， 芒 。 
及 所 拟 合 的 分 布 曲线 天 之 间 的 偏离 * 愈 小 拟 合 钝 好 ， 如 果 对 一 
组 具体 观察 数据 算出 之 值 为 ho， 则 根据 Pearson 在 1900 年 证 
明 的 一 个 极限 定理 (定理 3.1), 可 以 近似 算出 概率 PC(% 之 ho)， 这 
个 数 可 称 为 拟 合 优 度 。 因 为, 这 个 数 愈 大 (小 ), 则 产生 象 加 这 么 
大 或 更 大 的 偏离 的 机 会 愈 多 ( 少 ), 因而 实际 得 到 ho 这 么 大 偏离 这 
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件 事 并 不 稀奇 (比较 稀奇 ). 
到 此 为 止 还 没有 假设 检验 的 含义 ， 只 不 过 是 定义 了 一 个 反 疾 
拟 合 程度 优 劣 的 指标 一 一 氢 合 优 度 ， 如 果 必 须 作出 “是 否 录 用 曲 
线 Pr" 的 决定 , 则 必须 定 下 一 个 阐 值 a( 如 a~0.01, 0.05,0.1 等 )， 
规定 当 拟 合 优 度 小 于 a 时 ,就 不 录用 五 ,否则 就 录用 瑟 ， 据 此 就 可 
以 把 问题 提成 假设 检验 的 形式 ， 
假设 瓦 : 全 1,，…, 于 ,是 从 具有 分 布 的 总 体 中 抽出 的 样本 . 
(3.1) 
检验 的 方法 是 : 指定 阐 值 %, 算出 拟 合 优 度 p， 当 p<a 时 否定 瑟 ， 
2>>w 时 接受 及. 
一 般 地 , 如 果 我 们 有 一 个 理论 、 假 说 等 , 需要 通过 实践 去 检验 
之 , 则 只 要 能 设计 一 种 观察 或 试验 , 使 其 结果 于 当 理论 或 假说 成 
立时 有 确定 的 分 布 ， 则 关于 该 理论 或 假说 是 否 正确 的 问题 , 转 
化 为 检验 假设 (3.1)， 其 中 也 1, …, 了 ,是 开 的 独立 观察 值 ， 检 
验方 法 可 以 用 上 述 Pearson x? 检验 法 , 也 可 以 用 种 种 不 同 的 方法 
定义 有 1,…, 琶 。 与 五 之 间 的 偏离 ,从 而 引出 种 种 不 同 的 检验 法 ， 
这 些 都 可 以 称 为 拟 合 优 度 检 验 . 由 玉 . Pearson 开创 的 这 个 方向 
上 的 工作 , 是 假设 检验 的 一 个 重要 组 成 部 分 . 


(三 ) Fisher 的 思想 .显著 性 检验 

1919 年 , Fisher 进入 Rothamsted 农业 试验 站， 那里 及 , 
Pearson 领导 的 一 个 统计 学 家 小 组 , Fisher 在 此 从 事 统 计 学 和 和 遗 
传 学 方面 的 研究 工作 ， 他 通过 田间 试验 研究 试验 设计 , 与 此 结合 ， 
对 由 试验 数据 作出 归纳 式 推断 的 基本 原理 ,， 作 了 探讨 ， 他 的 成 果 
后 来 大 都 总 结 在 他 的 和 名著 kThe Design of Experiments3 中 , 灶 书 
前 三 悍 着 重 讨 论 了 一 些 基 本 观点 , 其 中 包括 他 提出 的 显著 性 检验 ， 
现 通过 Fisher 仔细 论述 过 的 例子 ,来 说 明 他 的 观点 . 

例 8.2 女士 品 禁 的 试验 ， 

一 种 饮料 由 牛奶 与 茶 按 一 定 比 例 混合 而 成 ， 可 以 先 倒 茶 后 牛 
奶 (TM) 或 反 过 来 (MTJ)。 某 交 士 声称 ， 她 可 以 鉴别 是 了 TM 还 是 
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MT， 设 计 如 下 的 试验 , 来 检验 她 的 说 法 是 和 否 可 人 和信， 准备 8 杯 饮料 
TM 和 MT 各 半 , 把 它们 随机 地 排 成 一 列 让 该 女士 依次 品尝 , 并 告 
诉 她 TM 和 MT 各 有 4 杯 ， 然 后 请 她 指出 那 4 杯 是 了 TM， 设 她 全 
说 对 了 . 
Fisher 推理 过 程 如 下 : 引进 一 个 假设 

五 ， 该 女士 并 无 鉴别 力 . (3.2) 
其 意义 是 这 样 的 : 当 互 正确 时 ,不 论 该 女士 如 何 做 , 她 事实 上 只 能 
从 所 提供 的 8 杯 中 随机 地 挑选 4 杯 作 为 TM， 从 8 杯 中 挑 4 杯 ， 


8 
不 同 的 指法 有 | 4 0 种 , 其 中 只 有 一 种 是 全 部 挑 对 。 因此 ， 大 
该 女士 果真 全 部 挑 对 ， 则 我 们 必须 承认 ， 下 述 两 个 情况 必 发 生 其 


= 
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1. 也 不 成 立 , 即 该 女士 确 有 一 定 的 鉴别 力 ， 

2. 发 生 了 一 件 ,其 概率 只 有 高- 的 事件 . 

第 二 种 情况 相当 于 在 一 个 万 有 70 个 球 的 合子 里 随意 摸 出 一 个 , 正 
好 摸 到 了 事先 指定 的 那 一 个 。 这 种 情况 比较 希奇 ， 因而 有 相当 的 
理由 承认 第 一 种 可 能 性 ， 或 者 说 , 该 女士 4 杯 全 挑 对 这 个 结果 ,是 
一 个 不 利于 假设 也 的 显著 的 证 据 ， 据 此 ， 我 们 否定 互 ， 这 样 一 
种 推理 过 程 就 叫做 显著 性 检验 ， 

如 果 该 女士 只 说 对 了 8 杯 , 则 表面 上 看 , 4 杯 说 对 3 杯 , 成 绩 
不 错 . 但 我 们 要 计算 一 下 , 绪 粹 出 于 碰巧 而 得 到 这 个 以 至 丑 好 的 
成 绩 , 其 机 会 有 多 大 简单 计算 表明 ; 在 豆 成 立 , 即 70 种 不 同 所 
法 为 等 可 能 时 , 挑 中 杯 数 之 3 的 概率 为 17/70 一 0.248， 发 生 一 个 
概率 为 0.243 的 事件 并 不 希奇 ， 因 此 ， 试 验 结果 没有 提供 不 利于 
如 的 显著 证 据 . 

自然 , 人们 可 以 说 ,去 -的 概率 虽然 不 大 , 但 在 一 次 试验 中 发 


生 了 总 非 不 可 能 ， 这 个 说 法 无 法 驶 例 . 人 们 对 这 种 问题 的 态度 ， 
与 事情 的 重要 性 及 可 能 的 后 果 有 关 ， 要 得 到 一 个 判断 的 决定 ,就 
.08 。 


须 指 定 一 个 阁 值 w(0.01 0.05, 0.1 等 )， 只 有 在 算出 的 概率 
( 即 上 文 的 动 ，0.248 等 ) 小 于 «时 ， 才 认为 结果 是 显著 的 (提供 


了 不 利于 五 的 显著 证 据 ), 并 导致 否定 万 ， 如 在 此 例 中 , 当 取 a= 
0.01 时 ,即使 4 杯 全 对 也 不 认为 结果 显著 , 而 若 取 a 一 0.05, 则 认 
为 是 显著 了 ， 读 者 不 难 理解 , 这 里 并 无 任何 矛盾 ,因为 a 值 是 约定 
的 ,a 称 为 检验 所 用 的 显著 性 水 平 ，w 念 低 ， 获 得 显著 结果 念 难 ， 
所 导致 的 否定 顾 的 结论 念 觉 可 信 . 

据 这 个 例子 不 难 把 Fisher 显著 性 检验 的 思想 归纳 成 以 下 几 
点 ， 

1. 有 一 个 明确 的 命题 (假设 ) 五 

2. 设计 一 定 的 试验 , 观察 某 变量 了 ， 臣 要 有 这 样 的 性 质 ; 当 
万 成 立时 ,下 有 已 知 的 分 布 .如 在 上 例 中 , 若 以 也 记 该 女士 说 对 的 
杯 数 , 则 下 有 超 几 何 分 布 ， PC 人 (3 )/(s) ji 一 0， 

" . 忆 \4—i 4 

1, 4. : 

3. 根据 互 季 的 具 休 内容, 对 工 的 什 排 一 个 次 序 ， 使 全 
靠 前 的 值 , 愈 对 五 不利， 在 上 例 中 ,这 个 排 法 是 和 3, 2, 1, 0. 

4. 以 s 记 下 的 观察 信 ， 按 2 中 求 出 的 分 布 , 把 2 和 比 ~ 更 
侈 前 的 值 的 概率 之 和 求 出 来 暂 记 为 pe， ps 全 小 , 试验 结果 = 僵 
不 利于 五 

5. 算出 ps 后 ,统计 学 家 的 工作 也 就 完了 ， 他 可 以 把 ps( 连 同 
其 得 出 过 程 ) 报 告 给 主事 人 ,让 后 者 去 估量 它 的 含义 ， 如 果 必 须 提 
出 明确 结论 ， 则 必须 事先 给 出 (由 主事 烙 自 定 或 有 关 主 事 者 协商 ) 
显著 性 水 平 a 当 PP <a 时 否定 甩 , ps 之 时 接受 且 . 

显著 性 检验 这 个 名 词 还 可 以 从 更 实际 的 意义 上 去 理解 ， 在 工 
农业 中 , 假设 检验 问题 常 在 这 种 情况 下 出 现 ， 有 两 个 处 理 (如 两 种 
工艺 流程 .两 个 种 子 品种 .两 种 施肥 方法 等 )4、B，4 是 原 有 的 ,已 
用 了 相当 一 个 时 期 .是 新 的 , 设想 是 一 种 改进 ， 我 们 要 通过 试验 
米 判 断 B 是 否 确 优 于 和 4 于 是 引进 假设 卫 
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了 H: 4, B 效果 一 样 . (8.3) 
我 们 心目 中 当然 是 想 否 定 也， 只 有 试验 结果 表明 B 的 优势 是 “ 显 
著 " 时 , 才 有 根据 这 样 做 ， 何 亩 显著 ?就 必须 按 前 述 的 观点 去 解释 ， 
下 面 的 例子 (也 出 自 Fisher) 清 楚 说 明了 这 一 点 . 

例 8.3 为 比较 4. 了 3 两 种 施肥 方法 何者 为 优 ， 选 择 巧 块 一 
般 大 的 地 , 把 每 块 分 成 形状 大 小 一 样 的 两 小 块 , 随机 地 将 其 中 一 块 
派 给 4, 另 一 小 块 给 B， 各 小 块 产量 为 

块 号 

4 188 96 168 176 153 179 177 163 146 178 186 168 177 184 96 
B189168160 160 147 149 149 122 133 144 180 144 102 124 144 
4_PB49-678 16 6 283 28 41 14 29 56 24 75 60 —48 
算出 于 (4 一 B) 一 314. 现存 要 在 假设 { 囊 : 4,B 效果 一 样 ] 之 下 ,把 
可 能 的 试验 结果 按 对 五 不 利 的 程度 排队 、 在 五 成 立时 , 每 块 内 
4 一 B 值 ( 即 49， -67… 等 )， 并非 由 于 4、B 效 果 不 同 , 而 是 由 于 


两 小 沁 的 差别 ， 但 随机 化 的 结果 ,每 一 小 决 有 同等 可 能 ( 豆 ) 分 给 


4 或 B， 因 此 ， 如 在 第 一 块 ， 依 随机 化 结果 不 同 ，4 一 B 可 以 是 
49, 也 可 以 是 一 49, 要 看 较 好 的 那 小 块 派 给 4 还 是 B。 这 样 一 来 ， 
这 个 试验 的 全 部 可 能 的 (4 一 B) 值 有 2” 个， 
土 (49) 土 (一 67) 土 (8)… 土 (60) 土 (一 48)， (3.4) 
实际 得 出 的 314 是 34 中 的 一 种 . 当 4, B 效果 有 较 大 差别 时 , | 之 
(4- 了 3)| 应 取 大 值 。 于 是 ， 按 其 绝对 信 大 小 ,把 (3.4) 中 的 2 个 
V1 Da “Vo (3.5) 
(3.5) 中 的 324 个 值 , 在 吾 成 立 的 前 提 下 ,为 等 可 般 ， 苑 每 个 出 现 
的 概率 都 是 2-4， 找 出 mw, 使 314 一 mw， 则 314 及 比 之 对 如 更 不 
利 的 值 , 在 HH 成 立时 出 现 的 机 会 只 有 ps 一 m1|25。 本 例 可 具体 
算出 Peaks<0.0001. 因 此 ,即使 在 w 一 0.0001 的 显著 性 水 平 下 ,也 有 
理由 否定 五 ， 这 样 ,试验 结果 提供 了 很 显著 的 证 据 ,不 利于 肌 . 由 
于 314>>0, 结论 是 : 有 很 显著 的 证 据 表 明 4 优 于 8. 
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Fisher 的 理论 中 缺少 一 件 很 重要 的 东西 : 同一 个 假设 可 以 用 
很 多 不 同 的 方法 去 检验 , 如 何 比较 其 优 劣 ? 考虑 这 个 问题 ， 就 智 要 
建立 合理 的 比较 准则 ,并 在 这 种 准则 之 下 找 最 优 者 .Fisher 没有 
考虑 这 个 问题 。 因 此 他 虽 在 开创 假设 检验 这 个 方向 起 了 重大 的 作 
用 , 却 未 能 建立 一 套 形 式 完美 的 数学 理论 ， 拿 例 3.2 来 说 ,可 以 把 
试验 作 一 点 修改 . 不 告诉 该 女士 TM 和 MT 各 4 杯 ， 而 让 她 一 一 
指明 8 杯 中 的 每 一 杯 是 工 M 或 MT, 按 她 说 对 的 杯 数 去 下 判断 .在 
直观 上 , 读者 一 定 会 党 得 , 这 修改 后 的 设计 比 原来 的 好 .但 在 怎样 
的 意义 下 好 ， 如 何 确切 地 论证 ， 并 不 是 一 目 了 然 的 J. Neyman 
和 下. 8S， Pearson 的 理论 补足 了 这 一 点 . 


$3.2 拟 合 优 度 检验 


一) 引言 

拟 合 优 度 检验 问题 的 提 法 , 已 在 $3.1 中 说 明 过 了 ; 设 有 一 个 
可 观察 的 、 一 维 或 多 维 的 随机 变量 全。 对 1, …, 卫 。 是 苹 的 独立 
观察 值 ， 玉 是 一 个 已 知 的 分 布 耳 数 , 其 维 数 与 全 的 维 数 相同 。 要 
利用 样本 车 1,…，, 环 , 去 检验 假设 

刁 : 了 的 分 布 为 了. (3.6) 
或 者 也 可 以 这 样 担 .: 如 果 用 分 布 去 拟 合 样本 耻 1,…, 卫 。， 则 所 
合 的 优良 程度 如 何 . 玉 常 称 为 理论 分 布 . 

在 $3.1( 二 ) 中 概述 了 处 理 这 个 问题 的 一 般 原则 . 设法 确定 一 
个 量 D(X …， ms FF)， 它 有 茶 种 理由 可 以 作为 梯 本 让 1,…， 
访 , 与 的 偏离 的 度量 .。 就 具体 样本 算出 了 之 值 ， 记 为 De。。 然 
后 在 假设 互 成 立 的 条 件 下 算出 概率 

2p(DPo) = P(D>DolH). 
它 称 为 在 磷 定 的 偏离 指标 D 之 下 ， 样本 与 理论 分 布 的 拟 合 优 度 . 
这 个 数 介 0, 1 之 间 、%(Do) 愈 大， 表示 样本 与 理论 分 布 的 拟 合 
愈 好 ,而 假设 (3.6) 愈 囊 信 ， 一 般 ,事先 根据 某 种 考虑 ,给 定 一 个 介 
于 0, 之 间 ( 通 常 很 小 ) 的 闹 信 a, 然后; 
es。 J0l. 


当 2( Do<a 时 否定 五 . 当 2(Dw>>a 时 接受 五， (3.7) 
这 种 类 型 的 检验 通称 为 拟 合 优 度 检 验 ， 由 于 卫 可 以 用 种 种 不 同 
的 方法 定义 ,可 以 有 种 种 不 同 的 拟 合 优 度 检验 ， 其 中 最 著名 的 ,是 
及 . Pearson 在 1900 年 提出 的 x? 检验 ， 和 KorMoropos 在 1933 年 
提出 的 一 种 检验 ， 本 节 将 讨论 这 些 检验 , 以 前 者 为 主 ， 


(二 ) Pearson X2 检验 ; 理论 分 布 完 全 已 知 的 情况 
1. 先 设 所 只 取 有 限 个 不 同 的 值 W1, "**) 人 Zr， 理论 分 布 五 集 
中 在 w 点 的 概率 记 为 pp， 假 设 (3.6) 写 为 . 
H., P(X =) 一 Di 4 一 二 个。 (p>0 己 知 ， Sp-D 
(3.8) 
以 2 记 1 “"**) 有 天。 中 等 于 Wi 的 个 数 , 2 称 为 Gs 的 观察 频 


数 ， 有 六 w 一 六 ap 称 为 a 的 理论 频数 , 意 即 当 了 的 分 布 确 为 
时 ，x “在 理论 上 ”应 取 之 值 (事实 上 这 时 有 Br=np)，K. 
Pearson 引进 如 下 的 统计 量 ( 常 称 Pearson x? 统 计量), 以 反映 样 
本 与 理论 分 布 的 偏离 ， 

hb(Ry 1, Ru BF) Sv) /np (3.9) 


其 直观 背景 是 ; 百 ( 一 np)? 当 互 成 立时 等 于 jipi(1 一 p), 而 当 五 
不 成 立时 ,五 (z 一 npi) ”一般 要 大 于 wo 一 0)，w2: 是 一 个 调整 因 
子 . 

如 前 所 述 ， 对 一 组 具体 样本 算出 有 一 加 后， 要 计算 拟 合 优 度 
p(ko) 一 Pi 之 bo| 五 ). 的 真确 分 布 很 复杂 , 故 精 确 地 计算 p(%o) 
不 易 ， 玉 . Pearson 在 其 1900 年 工作 中 证 明了 下 面 的 重要 定理 . 

定理 3.1(K. Pearson) ”车 假 设 吾 真确 ， 则 当 样 本 大 小 n> 
co 时 ,统计 量 寺 的 分 布 收敛 于 好 -+ 即 自 由 度 为 7 一 1 的 x 分 布 . 

由 此 定理 , 当 m 较 大 时 可 得 2(0po) 的 近似 值 


Pbo) ~ [2 rT( )] | e zz 二 do (3.10) 
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此 值 可 在 较 仔 细 的 娄 分 布 表 上 上 查 出 (必要 时 插值 ). 一 般 , 先 给 定 了 
一 个 值 a(0.01, 0.05 等 ), 从 娄 分 布 表 上 查 出 满足 条 件 也 (xz2_1> 
Xi(o0) 一 a 的 值 x2_1(0) ,然后 视 看 > 入 -io 或 否 ,决定 否定 或 接 
受 吾 ， 这 就 是 Pearson 的 拟 合 优 度 x? 检验 ， 

我 们 把 定理 3.1 的 证 明 放 在 $3.3 的 (六 ) 段 ， 现 举 一 例 . 

例 3.4 一 家 工厂 分 早 中 晚 三 班 ， 每 班 8 小 时 ， 近期 发 生 了 
一 些 事故 , 怀疑 班次 不 同 与 事故 出 现 率 是 否 有 关 在 记录 的 近期 
15 次 事故 中 , 有 6 次 在 早 班 , 3 次 在 中 班 , 6 次 在 晚 班 ， 要 根据 这 
一 观测 资料 来 作 判 断 . 

提出 这 样 一 个 假设 互 ;“ 宁 故 的 可 能 性 大 小 与 班次 无 关 ”， 先 
要 把 这 一 陈述 化 为 一 个 概率 命题 ， 虚设 一 个 变量 了 了 , 取 1.2、3 为 
值 ， 意 义 是 : 若 事 故 在 早 班 发 生 , 有 一 1; 在 中 、 晚 班 发 生 , 则 成 相 
应 等 于 2 和 8383， 这样 ,上 述 假设 五 可 写 为 (3.8) 的 形式 ; 

PF({D)=1/3, $=1, 2，3. 

本 例 中 n=15, Pi1= pa— ps=1/3, pi=6, »a=3, vs=6. 按 (3.9) 
算出 克 一 二 [C6 一 加 ?了 (3 一 5)?++ (6 一 可 一 1.2, 查 x 分布 表 ( 自 
由 度 为 3 一 1~2), 知 在 瑟 成 立时 ， Pri> 圭 这 个 数 并 不 很 
小 (在 一 次 试验 中 , 发生 一 个 概率 为 二 去 的 事件 ,并 不 希奇 )， 因 此 ， 
所 掌握 的 资料 并 未 给 “事故 可 能 性 大 小 与 班次 有 关 ? 的 说 法 给 予 充 
分 支持 ， 自 然 ,这 不 能 解释 为 资料 证 明了 “无 关 ” 甚至 也 不 能 解释 
为 充分 支持 了 “无 关 ” 的 说 法 。 其 确切 意义 只 能 是 如 上 所 述 : 资料 
未 给 “有 关 ” 的 说 法 以 充分 支持 . 

对 统计 思想 不 大 熟悉 的 人 , 对 此 可 能 会 觉得 难以 理解 ， 因为 
看 起 来 , 6:3:6 的 比例 应 当 是 充分 证 明了 中 班 事故 率 低 于 平均 值 
言 .对 此 我 们 再 加 一 点 解释 。 其 实 , 这 里 涉及 一 个 纯 推断 或 采取 
行动 的 问题 、 我 们 所 作 的 推断 是 说 : 即使 三 班 的 事故 率 一 样 , 但 仅 
由 随机 原因 (正如 把 15 个 球 随机 放 到 三 个 合子 中 ) 产 生 这 种 表面 
差别 的 机 会 ， 也 大 到 1/3 以 上 ， 你 在 (平均 )100 家 事故 率 与 班次 
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无 关 的 工厂 中 , 会 发 现 30 家 以 上 , 其 表面 差别 甚至 比 这 更 大 ， 因 
此 从 纯 学 理 ( 推 断 ) 的 角度 ， 在 这 样 的 情况 下 断言 事故 率 与 班次 有 
关 , 确 不 其 令 人 信服 ， 但 是 , 如 果 你 是 这 工厂 的 一 位 工程 师 , 你 可 
能 会 认为 ， 上 述 表 面 上 的 差别 已 构成 充分 的 理由 去 作 一 看 进一步 
的 研究 , 看 是 否 能 找 出 中 班 事故 率 较 低 的 原因 、 这 样 做 也 可 能 有 
益 或 无 益 . 是 否 这 样 去 做 ,上述 推 凯 中 提供 的 数字 1/3 是 一 个 考 虚 
的 因素 ， 另 外 , 事故 后 果 的 严重 性 , 作 进 一 步调 查 的 费用 等 , 也 是 
在 作出 决策 过 程 中 的 因素 . 

2. 现 设 理论 分 布 王 为 一 般 的 . 若 为 一 维 , 则 选择 适当 的 
常数 cu …, ar-1 满足 -co 天 gi 二 到 -<<co， 以 把 (一 co，co) 
分 解 为 了 个 区 间 : 

1 一 (一 co，ai) ，7a 一 [ai， ce)，……， 
T= [@y1, go)，…，T 一 [or °°). (3.11) 
若 革 是 m 维 的 而 m%>1, 则 要 把 EE” 分 解 为 7 个 彼此 无 公共 后 的 
区 域 1 ,，…, ZT:. 记 
p= Pr(X ED)=F0) — Fas), j=1, ,7. 

. (有 (go =0, Flar) =1) (3.12) 
这 些 都 是 已 知 数 ， 且 Q1,…, 4r-1 选择 之 使 p>0,…, pr 之 0 以 
包 记 sy,…, 天, 中 落 在 荆 内 的 个 数 ,而 作出 统计 量 #((3.9) 式 )， 
则 在 如 成立 ( 即 对 确 有 分 布 卫 ) 时 , 当 n->oo 时 定理 3.1 的 结论 
仍 真 、 因 此 , 象 在 于 离散 的 情况 一 样 , 可 计算 拟 合 优 度 并 对 已 加 
以 检验 . 

这 个 作法 ， 实 质 上 就 是 用 一 个 如 下 定义 的 离散 分 布 五 来 代 
替 了 ;在 五 …, 了 内 各 取 一 点 931， ar。 令 分 布 玉 在 oj 所 的 
概率 为 py, j 一 1,，…, ?。 所 算出 的 t 值 (3.8)， 反 蜡 了 样本 了 X,， 
…， 防 ,与 分 布 ”的 偏离 。 不 过 我 们 可 以 这 样 想 . 六 是 了 的 一 
种 “粗糙 化 ”， 形 象 地 说 ， 在 F” 中 舍弃 了 中 的 某 些 细部" 故 若 
人 1 到 与 较 粗 的 F"” 的 拟 合 尚且 不 好 , 自 没 有 理由 认为 , 它 反 
面 与 喝 精 细 的 了 拟 合 得 好 ， 因 此， 知 样 本 于 1,，…'， 天 ,与 的 
拟 合 优 度 值 很 低 ,， 则 我 们 有 充分 理由 认为 “对 有 分 布 "的 假设 不 
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对 . 反 过 来 则 不 然 : 若 了 1,，，…， 子 ,与 较 粗 的 五 拟 合 不 错 , 它 不 
一 定 能 很 好 地 拟 合 更 精细 的 了， 这 些 都 是 在 选择 (3.7) 中 的 ,以 
及 对 结果 作 和 解释 时 , 要 注意 的 问题 . 

一 般 ， 若 把 (3.7) 式 中 的 7 选 得 足够 大 ， 并 使 gt， …，0r-i 有 
适当 的 配置 ,我 们 总 可 以 把 7" 与 五 弄 到 很 接近 ,以 至 在 实用 上 认 
为 满意 .但 除非 样本 大 小 % 很 大 。 这 样 一 来 每 组 的 理论 频数 np 
和 观察 频数 > 都 会 很 小 ， 而 的 真确 分 布 与 xr-1 会 有 较 大 的 距 
离 。 以 此 , r+ 能 取得 多 大 , 取决 于 n。， 有 一 种 经 验 法 则 , 认为 每 组 
的 理论 频数 不 应 小 于 5。 另 一 点 要 注意 的 是 : (3.7) 式 中 的 gi, cs， 
… 等 必须 不 依赖 于 样本 .就 是 说 , 不 能 根据 样本 和 不 1， …， 到 。 的 位 
置 去 选择 它们 ， 而 必须 事先 定好 . 只 有 这 样 定理 3.1 的 结论 才 有 
效 . 在 实际 工作 中 这 一 点 常 没有 被 严格 遵守 .在 一 般 情况 下 ,由 此 
而 引起 的 误差 大 体 上 可 认为 能 忽略 不 计 . 


(三 ) 理 论 分 布 带 参 数 的 情况 
在 许多 问题 中 , 要 检验 的 假设 是 ; 变量 科 的 分 布 属于 一 个 确 
定 的 分 布 族 {F(c， 0，…， 00): (01,…, 91) EB} 确切 地 说 ,有 了 
下 的 独立 观察 值 他!,…， 下 ,要 由 它们 去 检验 假设 
瑟 ; 存在 (010, …, bo) E68, 使 王 的 分 布 为 
Fly, 010, *…, Oio). (3.18) 
如 在 统计 应 用 中 ， 常 假定 样本 了 1, …,， 也 。 抽 自 正 态 总 体 ， 当 对 
此 有 怀疑 时 , 可 通过 样本 去 检验 ， 在 此 , 并 不 要 求 的 分 布 为 某 
一 特定 的 正 态 分 布 , 例如 入 (0, 1), 而 只 要 求 存在 Ca, c), 使 总 体 
分 布 为 W(e, o3)， 问 题 当 然 也 可 从 “ 拟 合 ”的 角度 去 提 ， 例 如 ,K. 
Pearson 所 考虑 的 ， 从 Pearson 分 布 族 中 找 一 个 分 布 去 拟 合 已 有 
的 观察 数据 . 
Pearson 在 1900 年 的 工作 中 讨论 了 这 个 问题 , 方法 是 理论 分 
完全 已 知 时 的 直接 推广 ， 取 五 ,…', 攻 如 (3.11). 记 
p01 “0 0:)=F(g;, 01, *, 0,) —L (1, 91, *…, 0:). 
(8.14) 
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表达 式 ” 
Ek(0i, 四 9) = m0, ”… 0)]2?/npi(O， "oy 0.,) 
(3.15) 
是 并 ;1， 9 挟 ，。 与 分 布 F's, O11, 1 2 偏离 的 度量 ,但 凡 ， 本 0, 
为 未 知 参数 , Pearson 使 用 样本 政 1, …， 怀 , 去 估计 它们 . 若 久 = 
0( 玉 1，…， 互 ) 为 6; 的 适当 估计 , j 一 ，…, 去 则 以 之 取代 (3.15) 
中 的 0 j 一 1，…, 各 得 统计 量 
太一 有 (有 0). (3.16) 
Pearson 在 1900 年 工作 中 认为 ,在 这 个 带 参数 的 情况 下 , 定 
理 3.1 的 结论 仍 真 . 即 当 (3.18) 的 假设 瑟 成 立 而 "一 co 时 ,大 依 
分 布 收敛 于 x2.1， 若 果 如 此 , 则 前 述 计 算 拟 合 优 度 的 近似 计算 以 
及 假设 瓦 的 检验 法 , 都 可 照搬 过 来 ， 在 二 十 年 代 ，Fisher 发 现 了 
Pearson 在 推理 中 的 玖 忽 , 指 出 自由 度 不 是 7 一 1 而 应 为 "一 1 一 t. 
而 且 , 关于 估计 量 久 的 大 样本 性 质 还 有 所 要 求 ( 比 方 说 , 矩 估 计 一 
般 不 行 )。 这 个 问题 经 Fisher、Neyman、 卫 . S. Pearson 等 一 些 
著名 学 者 研究 过 ， 例 如 证 明了 : 在 一 定 条 件 下 ,下 面 两 种 估计 方法 
都 适合 要 求 ( 简 记 py(91,，…, 94) 为 py) 
1. 最 小 x 法 找 记 = 六 (To …， 及 。), j 一 4，…, 世 使 
6 B= min{h(0s, pp， Oi): 0, .…, 01) EQ}. 


(3.17) 
实际 计算 中 是 通过 和解 方程 组 
Bh(b1, »*, O02) /0 =0, 即 六 (2 多 -0 
j=1, 


这 个 方法 的 直观 意义 很 明显 : 也 (w, 扩 ,…, 久 ) 是 分 布 族 {F(z, 91， 
… 01): (01, …, 01) EB} 中 与 样本 偏离 最 小 的 分 布 ( 当 偏离 按 
(3.15) 定 义 时 )， 但 这 个 方程 组 很 难 解 . 

2. 另 一 个 方法 是 把 (全 ,，…, 全 ) 定 义 为 方程 组 


sj OP; 0 jl 3.18 
hb (3.18) 
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之 解 ， 其 意义 可 以 从 两 方面 去 解 帮 。 一 是 表达 式 p72Y…pw 是 观察 
结果 (v4, …, zr) 的 似 然 函 数 , 找 gj，…，,8 使 这 似 然 函 数 达 到 最 
大 , 即 得 (3.18)， 故 (1, …, 从) 是 01,…，0: 在 间接 意义 下 ( 即 先 
由 样本 是 1 ”5 于 ,过 渡 到 Bi ***, Dy, 再 用 之 去 佑 计 l， “””) 小 ) 
的 极 大 似 然 估计 , 另 一 个 解释 是 ; (3 .18) 是 由 (3. 二 ) 中 舍弃 括号 内 
第 二 项 而 得 ， 故 也 称 修正 最 小 x? 法 .使 弃 的 根据 是 按 大 数 定律 


了 之, 故 (vy 一 mpi)”/w 相对 于 六 一 2; 为 无 穷 小 ， 方 程 组 (3.18) 


比 43.17) 简 单 些 , 但 往往 也 需要 用 数值 方法 求解 

现在 给 出 极限 定理 的 严格 表述 . 其 证 明 超 出 本 书 范围 之 外 ， 
故 从 略 。 可 参看 陈 希 矣 «数理 统计 引 论 >p.298, p.302~305. 

定理 3.2 设 下 列 条 件 满足 . 

1° 6 为 BR! 中 的 开 集 ， 存 在 (010, …， bo EG， 使 王 的 分 布 
为 也 (ww，040,，…，9:0)( 即 假设 (3.13 ) 成 立 )， 

2” 按 (3.14) 定 义 py, 对 日 中 任意 两 个 不 同 的 点 (8 …，， 
G44) 和 (01s,…，0ia), 有 


[PA ***, Di ) — pi( O19, 7 G1a) |>0. 


3° Op;( 01, *""y 01)/60; 在 日 内 连续 ， 2 一 二 ， ”5 t, j=1, "yp 
4° 令 
ss -一 < 1 Op (0 0"» 0:) 
Trs(01, 2 8) > p(s, *, 0,) : 9- 
x 2 0, ) 
人 小 ， s=1, ***, t, 而 了 01， | 9:) 为 一 个 t 阶 方 阵 ， 其 (7， s) 元 为 
I,s(0)， 则 对 任何 (643，…,， 0;) EQ,，I(01,…, 0 ) 的 行列 式 不 为 0， 
5°( 信 ，…, 人 ) 为 方程 组 (3.18) 的 解 ， 且 是 (9 …, 0:) 的 弱 
相合 佑 计 . 
则 当 样 水 大 小 w->ce 时 ， 由 (3.15)、(3.16) 式 定义 的 统计 量 
hr 依 分 布 收敛 于 自由 度 ”一 1 -二 的 委 分 布 X_n 
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由 这 个 极限 分 布 的 形式 看 出 : 参数 个 数 蔚 必须 小 于 了 一 

例 3.5 在 例 2.12 中 ,描述 了 基因 4,B,0 的 频率 凡 ， 加 ， 刀 
《ba 一 工 一 凡 一 加) 与 备 型 0.4、.B、 4B 的 频率 pi,…， Ps 的 关系 为 
(2.22) 式 . 这 个 关系 是 在 一 定 的 遗传 学 理论 之 下 , 且 假 设 所 考察 
的 人 群 中 , 交配 是 随机 的 , 才能 成 立 ， 为 检验 这 些 假设 古 否 成 立 ， 
可 以 用 x2 检验 法 设 观 察 了 该 群 中 中 个 人 的 血型 ， 其 中 0、4.B 
和 有 4B 分 别 有 %,…, ?ua 人 ， 写 出 似 然 函数 (2.28)， 算 出 引 , 刀 ， 
Os 的 极 大 似 然 佑 计 (注意 要 在 久 十 级 十 0s 一 1 的 约束 下 求 )， 记 为 
01, U3,，0s。 算 出 

_ 《ma 一 na)? 下 《na 一 n(200s+ 从 ))? 
nO2 (OD,t py 


十 ( ns —n(20s0s+ 02))? (na — 2n0.)? 
n(26.0s+ 2) 2n06。 
此 处 ?一生 1 一 2， 按 定理 3.2， 在 假设 成 立 之 下 , 刀 有 极限 分 布 


Xi 

在 本 例 中 ， 变 量 了 是 一 个 只 取 4 个 值 (比方 说 1,，2, 3, 4) 的 
离散 变量 , 4 个 值 分 别 相应 于 4 种 血型 , 故 不 须 先 按 (3.11) 的 方式 
去 离散 化 . 

例 8.6 为 要 检验 一 组 样本 呈 …, 也 ,是否 从 正 态 总 体 
NW(a, a”) 中 抽出 的 , 先 按 (3.11) 分 组 ， 有 


Pi, -5 | 6 dy, 7 一 工 ,7 
(oo= 一 co, = 一 co)， 方程 组 (3.18) 有 形式 
| (2 一 &)e- {tw—0)/903 dz 
一 人 


一 一 一 一 一 一 ， 
1 上 BT 人 -用 930， dw 
Oj 


驻 j | 
| (x _ & 6 eo/20 gy 一 ao? | G 一 (2 一 0)37303 dz 
+ er 和 


> E i — 一 0 
一 | EC-0)37 2320 dr 
的 自由 度 为 ?一 1 一 2 一 人 一 3. 

士 述 万 程 组 并 不 容易 解 。 于 是 自然 地 会 这 样 想 ; 若 用 通常 的 
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方法 , 如 极 大 似 然 估计 元 以 及 二 疡 ( 荆 , 一 部 )? 去 估计 < 和 o 出 


大 为 方便 ， 在 别 的 问题 中 也 存在 这 种 情况 ， 即 方程 组 (3.18) 很 难 
解 , 但 直接 由 样本 及 1!，,…， 了， 去 求 参 数 9，…， 8 的 极 大 似 然 估 
计 则 较 易 。 然而 ,在 理论 上 可 以 证 明 : 若 用 页，…, 0; 的 极 大 似 然 
估计 外， …, 7 代替 (3.15) 中 的 (01, …, 9) 而 不 用 (3.18) 的 解 ， 
则 所 算出 的 x? 统计 量 不 一 定 有 极限 分 布 好 -;_:。 更 确切 地 , 证 明 
了 在 很 大 瞧 ， 真 正 的 拟 合 优 度 值 P(E( 供 ,…, 人 7) 之 ho| 五 ) 介 于 
P(x2_11 这 ho) 与 P(x2_1 之 bo) 之 间 ( 后 者 较 大 )， 按 定理 3.2 算 出 
之 值 为 前 者 , 而 当 无 参数 时 , 按 定理 3.1 算 出 之 值 为 后 者 .因此 ， 
这 个 结果 可 以 形象 地 解释 为 ， 用 极 大 似 然 信 计 {5} 而 不 用 (3.18) 
的 解 {6}， 相 当 于 把 损失 掉 的 自由 度 t 挽回 一 部 分 。 问 题 在 于 ,上 
(67, …, 9 站) 的 极限 分 布 不 再 是 % 分 布 . 


(四 )X2 方法 用 于 检验 独立 性 

每 个 人 按 其 是 否 吸 烟 可 分 成 两 类 ， 按 其 是 否 患 瘤 症 也 可 分 为 
两 类 ， 如 要 研究 在 某 一 群 人 (如 一 国 的 成 年 人 ,在 某 个 行业 工作 的 
人 ) 中 , 吸烟 与 患 肺癌 是 否 有 关 , 则 可 从 这 一 群 人 中 随机 抽取 若干 
个 ,一 一 记录 其 是 否 吸 烟 和 是 否 患 癌症 ,用 所 得 资料 去 进行 统计 分 
桥 . 

这 类 问题 在 应 用 上 碰 得 很 多 。 一 般 , 有 一 个 由 大 量 个 体 构成 
的 总 体 ,每 一 个 体 上 可 量度 两 个 属性 指标 : 4，B， 指 标 4 分 了 级 : 
A1, -…，Ar, 而 指标 如 分 s 级 : Bi, …，, Bs。 从 该 总 体 中 随机 抽出 
wn 个 个 体 , 测 得 第 个 个 体 的 指标 状况 为 (4r,，Bs), 5 一 1，…, nm. 
要 依据 这 些 资料 , 判断 4、.B 两 个 指标 是 否 有 关 . 关系 的 性 质 自然 
是 多 样 化 的 , 例如, 一 种 情况 是 当 个 体 的 4 指标 处 在 较 高 级 位 时 ， 
其 B 指标 也 倾向 于 处 在 较 高 级 位 (可 称 为 正 相 关 ). 

形式 地 引进 一 个 随机 癌 量 节 一 (下 中 ， 玉 久 )， 耶 中 和 于 外 分 别 
记 同 一 个 体 的 4、B 指标 的 级 ， 而 第 区 个 个 体 的 观察 结果 记 为 
《六 ,四 ) 一 了 按 上 文 的 记号 ,了 /二 (75) 2 一 1，*……*, m。 如 
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果 风 相对 于 总 体 中 的 全 部 个 体 数 很 小 ， 则 可 以 把 屋 :，…， 羡 看 
作 是 于 ci 而 “指标 4, B 无 关 ” 则 解释 为 “ 祁 ”与 
四 外 独立 
POE 一 和 =I), =1, ”, j=1, 3 
(3.19) 
则 由 概率 论 可 知 ,“ 卫 中， 节 思 独立 ”的 充 要 条 件 是 ， 存 在 Pp? ,….， 


?9 和 2 的 ，…, 92, 都 大 于 0， 加 2 一 加 2 于 使 得 


Py=— Pp py, b=1,， 人 j=1, "** 3. (3.20) 
把 pp 站, p 户 等 视 为 参数 , 则 假设 
万 :4, B 指标 无 关 , 即 政 中 .下 中 独立 。 (8.21) 


有 (3.13) 那样 的 形式 .事实 上 上 ,(3.19) ~(3.20) 定 义 了 一 个 二 维 
分 布 族 ， 而 (3.21) 的 假设 互 就 是 说 ，X 的 分 布 在 这 个 族 内 ， 因 
此 ,可 用 (二 ) 的 方法 来 检验 这 个 假设 , 

以 ny 记 了 1，…， 邓 ,中 取 (%, 人 j) 为 值 的 个 数 ， 则 观察 结果 可 
列 成 一 张 表 如 下 。 这 种 表 称 为 列 联 表 ,或 +Xxs 列 联 表 ,2x2 列 联 
表 义 常 称 为 四 格 表 . 表 中 6. 二 Dh -1m 人 .7 一 D1 no. 


此 处 卫 为 离散 型 的 , 其 值 域 上 共有 ws 个 点 ,每 个 点 相当 于 一 个 
I， 写 出 {ww 的 似 然 函数 ,为 


了 -= -I 11 (pp ms 
其 log 上 ,并 在 xpp-sop-1 的 约束 下 求 极 值 。 简单 计算 表明 ， 
. 110° 和 


家 天 值 当 2 中 一 p49 和 28 一 鸭 2 时 达到 ,其 中 
PD = n/n, C= 1, ""°y 全， p=%n j/%, j= 1, """y 3 


(3.22) 
算出 六 统计 量 之 值 
# rT 8 (iy 一 Np pp) 
大 We es 一 人 的 = 全 人 [it dd 
> _ 1). | 2 
>> Rn oD, . (3 3) 


nn 
(rs—1)— [Cr—1)+t (8—1)]=(r—1)(s—1). (3.24) 

因为 02，…，2P 中 只 有 7 一 工 个 独立 参数 , 22 、…、22 中 只 有 
8 一 1 个 独立 参数 ， 全 部 独立 参数 个 数 为 (7 一 1) 十 (s 一 1)= 二 7 十 8s 一 
2. 指定 阐 值 a, 查 表 找 出 x6-v6e-p(a)、 当 (3.28) 式 算得 的 太 超 
过 局 -pe-p(%) 时 ,否定 假设 五 , 即 认为 4, B 两 指标 有 关 . 

也 可 能 , 指标 是 连续 取 值 而 不 是 分 成 几 个 离散 的 级 别 。 例 如 ， 
4 指标 是 一 个 人 每 日 的 平均 运动 时 间 ， 而 了 指标 是 其 体重 ， 这 
时 , 可 以 把 每 个 指标 的 取 值 范围 象 (3.11) 那样 分 成 者 干 个 区 间 , 然 
后 按 离散 的 情况 去 处 理 之 .. 所 考 虚 的 指标 个 数 也 可 以 多 于 2。， 这 
时 称 多 重 列 联 表 . 独立 性 检验 的 方法 是 类 似 的 ， 

顺便 指出 ; 当 7 一 s~=2 时 , 由 (3.24) 知 自由 度 为 1, 按 Pearson 
1900 年 工作 (认为 自由 度 不 因 有 参数 而 变化 ) 则 应 为 3，Fisher 
正 是 在 这 个 特例 中 看 出 Pearson 的 错误 .他 在 1922、1923 年 的 工 
作 中 , 用 实际 数据 给 出 了 自由 度 应 为 工 的 .有 说 服 力 的 证 据 .， 


五) 入 方法 用 于 检验 齐 一 性 
设 有 > 个 生产 同一 种 产品 的 工厂 ， 六 部分 为 8 个 过 级 ， 第 5 
个 工厂 中 的 7 等 级 品 率 为 P41( 四 , j 一 1，…， 3， 多 一 ,7; 两 个 工 
三 产 品质 量 相 同一 语 ， 璇 为 其 相应 等 级 品 率 相同 于 是 ?个 工 
厂 产品 质量 齐 一 这 个 假设 , 可 表 为 
H:p(j)= pp(D, jl s,s, . (3.25) 
»- jiie。 


列 在 从 第 宇 个 工厂 的 产品 中 抽出 mw 个 ， 记录 其 中 的 了 等 吕 有 mg 
个 ,j=1,…, 8 5 一 二 …， ,要 依据 观测 结果 {ms} 去 检验 假设 五. 

一 般 , 有 7 个 各 包含 大 量 个 体 的 同类 总 体 ， 每 个 个 体 的 指标 
可 处 在 * 个 等 级 中 的 一 个 , 其 余 pe( 门 , mx., rw 等 ， 都 有 相应 的 解 
释 , 则 (3.25) 的 假设 互 就 理解 为 “这 > 个 总 体 (就 这 指标 的 分 布 而 
言 ) 是 齐 一 的 ”, 因此 五 常 称 为 齐 一 性 假设 . 

所 得 数据 {mj} 也 可 以 象 独 立 性 检验 那样 排 成 一 个 "xs 列 联 
表 .。 不 仅 如 此 , 形式 上 我 们 可 以 把 齐 一 性 假设 看 成 是 一 种 独立 性 
假设 .为 此 对 每 一 个 体 引进 两 个 指标 对 中 和 于 中 ， 瑟 中 是 该 个 
体 廊 属 总 体 的 编号 , 而 卫 咏 是 它 的 指标 等 级 , 例如 , 对 第 二 个 工厂 
的 三 等 品 而 言 , 卫 中 2, 邓 久 一 8， 这 时 , “指标 分 布 与 总 体 编号 无 
关 ” 一 语 , 就 可 以 改 说 成 “ 陡 中 与 对 外 独立 ”?， 因 此 ,可 用 (三 ) 中 的 
方法 去 检验 假设 (3.25), 所 有 的 计算 全 相同 . 

但 是 , 若 仔细 考察 一 下 , 就 会 看 到 二 者 之 间 有 一 个 实质 性 的 莽 
别 : 在 齐 一 性 问题 中 , 从 第 总 体 中 抽出 的 个 体 数 ww. 是 事先 给 定 
的 , 它 没有 随机 性 .而 在 独立 性 问题 中 , 相应 的 wi 是 ; 样本 中 4 指标 
处 在 等 级 纪 的 个 体 数 . 这 个 数 事先 并 无 规定 而 依赖 于 抽样 的 结果 ， 
是 随机 的 .由 于 有 了 这 个 差别 , 定理 3.2 就 不 能 直接 用 于 齐 一 性 
问题 ， 市 必须 从 头 开始 . 经 过 复杂 的 论证 ( 见 陈 希 荞 < 数 理 统计 引 
论 >p.310~315), 证 明了 在 齐 一 性 问题 中 , 车 假设 (3.25) 成 立 , 则 
当 m.->c0，i=1,…, 7 时 ,由 (3.28) 定 义 的 统计 量 矿 仍 有 极限 分 
布 x%-va-p。 这 才 算 是 确实 证 明了 ，( 三 ) 中 独立 性 检验 的 方法 仍 
可 用 于 此 处 . 

如 果 所 考察 的 指标 是 连续 取 值 的 , 则 以 7, 记 第 i 总 体 中 指标 
的 分 布 ,而 假设 (3.25) 写 成 

H:F=Fs=*…=F,. (3 .26 

这 种 问题 常 称 为 多 样本 问题 ， 有 种 种 检验 方法 ，x? 方法 即 其 中 之 

. 为 此 , 先 象 (3.11) 那 样 , 把 指标 的 值 域 分 组 以 实现 离散 化 , 并 
将 ng 定义 为 ,第 5 总 体 所 抽出 的 样本 中 ， 其 指标 值 落 在 五 内 的 个 
将， 然后 用 列 联 表 的 方式 去 处 理 。 
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(六 ) 定 理 3.1 的 证 明 
沿用 (3.8)、(3.9) 式 的 记号 ， 注 意 在 假设 (3.8) 成 立时 , (vi 
Vr) 有 多 项 分 布 . 


n! 1 ny 
D1 Pr 
Wil! 


(Gn Ny 都 是 非 负 整 数 ， 且 和 为 mn)， 出 此 知 (zi，…， y;) 的 
特征 函数 为 (以 下 人 一 一 1) 
gti, **, tr) — (met! + et ror”)". 


令 卫 /二 (pj 一 np))/ Vnpi, j=1,…, ?. 则 p> 又 (Fi, 
了 .) 有 特征 函数 
ps -ep 人 (王宫 V 面 ) 
x 引 一 二 ee, 天 -), 
取 1log, 作 'Taylor 展开 , 易 得 
log p(t1, **, ts) —nlog| 1+i = D3 Vy 一 闻 - 2 


P(yi=n, 7, Vr— ny) = 


+ On) | -iV m2 V 


,i 1/ 一 9 i/ 

训 人 + 二 (加 VD) + On 3). 

于 是 得 : : 
了 1 <- 
lmp (加 雪 ) oxp(— 吝 Qt) (3.27) 


r 


其 中 二 次 型 Qu 太一 室 # 一 ( 轧 VD 如 ) 的 方 隆 为 4= 工 - 


pl 
pp, I 为 人 阶 单位 阵 而 p 一 (Vp, NE WPr ) 
记 Y=(Yy, ”3 了 》， 作 正 交 变 换 


ZZ = (1, “3 作 ) =— BY, 
使 B 的 第 一 行为 Pp。 则 2 一 2 -p=0. 故 由 
/nn 闻 
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变换 的 正 交 性 , 有 


1 一 2 十 了 一 一 bi (38.28) 
Z 的 特征 函数 为 由 (w) 一 p(B w 一 (ws …, Ww) '， 由 (8.25)， 有 
lim $(w) ~exp(— Q(B), (3.29) 


但 
Q(BW = (BW TBW) — (BU) pp BY) =-+ + 
(3.30) 
因此 (CBW)TCB%W) 一 wBBw=atw 而 9B' 除 第 一 元 为 外 ,其 他 
元 为 0( 这 由 B 正 交 且 第 一 行为 2 推出 )， 故 p(B"Ww 一 WW， 因 而 
(BW) pp'(B'w) 一 三 由 (3.29)，(3.30), 知 
lim yw) 一 exp( 一 睾 ( 吗 +… 二 8)). (3.31) 


由 此 式 及 特征 函数 的 连续 性 定理 , 知 (2s,…, 27) 当 w->oo 趋 于 一 
个 7 一 1 维 分 布 ,其 各 分 量 独 立 且 都 有 分 布 W(0, 1)， 因 此 当 w> 


co 时 有 六 从 一 > 愉 -1， 再 注意 到 (3.28), 即 得 俯 证 的 结果 ， 


(七 ) KoaMoropoB 检验 

这 个 检验 的 想法 如 下 : 先 通过 样本 卫 1,，…, 子 , 对 耻 的 分 布 
函数 作 一 个 估计 ， 车 此 估计 接近 于 给 定 的 分 布 函 数 了, 就 接受 假 
设 (3.6), 不 然 就 否定 (3.6)。 这 里 设 节 为 一 维 的 . 

定义 3.L 称 定 义 在 一 cc<zs<ce 的 函数 

E(w2) = F(t; 和 Xx) = …， 了 ,中 ， 小 于 ww 的 
个 数 ) 为 人 1,…, 芳 , 的 经 验 分 布 函 数 . 

注意 ， 当 固定 样本 了 Z，…， Xn 时，FnCw; 总 1 了 。) 作为 w 
的 函数 ， 满 足 一 维 分 布 函 数 的 三 个 基本 性 质 ， 非 降 、 左 连续 、， 
(一 00)==1 一 F,(oo) =0. 事实 上 它 是 这 样 一 个 随机 变量 8 的 分 布 
洱 数 ，& 取 每 个 全 ;为 值 的 概率 都 是 1/n( 车 有 %w% 个 了 取 同 一 值 
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%, 则 卫 (E 一 0@) 一 二 (X14,…, 芳 ,中 等 宁 4 的 个 数 )， 利 用 这 一 点 


不 难 把 避难 分 布 妆 的 概念 平行 地 扒 广 到 到 为 多 维 的 情况 
当 固 定 2 时 ,Fw(o， 开 3， 写作 为 1，…， 了 XY, 的 函数 ,是 
一 个 统计 量 , 具有 性 质 ， 
E(F,(2))=P(X<%), lm F,(2)~— P(X<Y), 0.s.. 


由 这 些 性 质 可 知 ，F， 是 下 的 分 布 的 一 个 良好 估计 .定义 一 个 反 
映 经 验 分 布 Fo 与 假设 的 理论 分 布下 的 偏离 的 量 。 这 样 的 量 当 然 
有 很 多 方法 可 以 定义 .Koxmoropos 选择 的 是 一 致 距离 ; 
1,.— Fi=sup{|F,(2)—F(2)|: —oo<%< 00}, 
它 常 称 为 2'，, 与 了 之 间 的 Komxoropos 距离 。 于 是 ， 按 在 (一 ) 中 概 
述 的 一 般 原 则 ,在 有 了 具体 样本 后 , 先 算出 上 述 距 离 之 值 Do, 然 后 
计算 概率 
2(Do = P(NF,— FI>DolH). 
它 就 是 在 Koxxoropo0s 距离 之 下 ,样本 芝 !,…,， 了 ,与 理论 分 布 ] F 
的 拟 合 优 度 ， 若 指定 一 个 阀 值 a 而 接 (8.7) 的 作法 去 检验 , 则 须 定 
出 常数 Ds, 使 
plDra) = 一 Cu 

然后 , 当 Do>> Du 时 否定 五 ,不 然 就 接受 瑟 。 这 就 是 KoxmoropoB 
的 拟 合 优 度 检 验 .。 但 经 验 分 布 函数 的 概念 不 是 始 自 Komxoropop. 

为 了 要 具体 施行 这 个 检验 ,或 算出 拟 合 优 度 pP(Do) ,需要 知道 
1F, 一 | 在 肪 成 立 的 条 件 下 的 分 布 ， 这 个 分 布 的 形式 极为 复杂 ， 
不 便 应 用 .1933 年 ，Koxmoropos 证 明 下 面 著名 的 极限 定理 : 车 
刀 ( 四 在 一 co<z<<coe 处 处 连续 , 则 


1— 3 (1 和 >0; 
pi \ 
1, A<0, 


用 这 个 定理 , 可 以 在 % 较 大 时 , 近似 地 决定 Duo 之 值 ， 例如, 当 %w 
较 大 时 ， DD,, 0.ot 司 工 . 628/、/m ， D,, v.05 人 1. 358/V n. 当 % 较 小 | 
时 ,对 若干 wx 值 , Do 可 以 从 有 关 的 统计 表 上 查 到 。 


lim P(IF,.— Fl>N\V en) -| 
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作为 (3.6) 的 两 个 不 同 的 检验 , Pearson x? 检验 与 Koxmorop0B 
的 检验 , 其 优 劣 比较 如 何 ? 大 体 上 可 以 这 样 说 .在 于 为 一 维 晶 理论 
分 布 完 全 已 知 时 ，KomMoropoB 检验 优 于 x? 检验 ， 因 为 1.x? 统计 
量 之 值 依赖 于 把 (一 co，co) 分 为 7 个 区 间 的 具体 分 法 ， 包 括 7 的 
选择 和 区 间 的 位 置 , Konmoropos 距离 |7, 一 看 则 没有 这 个 依赖 性 ， 
2 .一 般 说 来 ,Konmoropos 检验 的 鉴别 力 略 高 , 就 是 说 ,在 了 不 是 下 
的 分 布 时 , 用 Koxmoropos 检验 较 易 发 觉 之 . 

男 一 方面 ，Pearson 的 局 检验 有 其 优点 。 1. 当 革 是 多 维 时 ， 
处 理 方法 与 一 维 完全 一 样 , 极限 分 布 的 形式 也 与 这 个 维 数 无 关 , 2， 
尤其 重要 的 是 : 对 于 理论 分 布 包 含 参 数 这 个 重要 情况 , 理论 上 和 方 
法 上 都 与 理论 分 布 完全 已 知 的 情况 相似 ， 只 是 极限 分 布 的 自由 度 
相应 缩小 一 些 而 已 。 在 KororopoB 检验 的 情况 则 不 然 ， 对 每 个 
具体 的 分 布 族 ( 例 如 , 检验 理论 分 布 属于 正 态 分 布 族 、 指 数 分 布 族 
(1.8) 等 ), 需要 作 特 殊 的 处 理 , 且 难 度 很 大 , 目前 只 对 裤 个 别 分 布 
族 作 了 出 来 ,其 中 尚 不 包括 极端 重要 的 正 态 分 布 族 (对 这 个 情况 ， 
用 随机 模 氢 的 方法 造 了 表 ). 

除了 Roxmoropos 检验 以 外 , 经 验 分 布 函数 在 假设 检验 (不 一 
定 是 拟 合 优 度 检 验 ) 中 还 有 一 些 其 他 的 应 用 ， 如 Cramer-von 
Mises 检验 、CMEpH03 检验 等 。 这些 检验 在 实用 上 的 意义 较 小 , 而 
从 理 论 又 涉及 很 复杂 的 极限 定理 .这些 定 理 的 证 明 其 至 在 一 般 的 
非 参 数 统 计 专 著 中 都 不 给 出 , 而 必须 查看 原始 文献 。 因此 这 里 都 
从 略 了 。 


§3.3 Neyman-Pearson 理论 


从 1928 年 开始 的 大 约 10 年 时 间 内 ，J. Neyman 和 卫 . 8&S. 
Pearson 合作 发 表 了 一 系列 的 论文 ,建立 了 假设 检验 的 一 种 数学 
理论 , 通称 为 Neyman-Pearson 理论 (简称 NP 理论 ).， 这 是 假 
设 检验 B 至 整个 数理 统计 学 中 的 一 个 重大 事件 .本 节 的 目的 是 
介绍 NP 理论 的 基本 概念 ,有 些 细节 内 容留 待 $ 3.4 讨论 ， 
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(一 ) 问 题 提 法 . 原 假设 和 对 立 假设 

设 有 样本 芒 ， 取 值 于 样本 空间 4 . 只 知道 的 分 布 属 士 一 
个 分 布 族 {FolEgG( 这 一 点 作为 模型 假定 ,或 可 由 具体 问题 的 担 
法 得 到 , 总 之 它 不 是 检验 对 象 ). 设 Bn 是 外 的 一 个 非 空 真子 集 ， 
则 命题 五 :2EGz 称 为 一 个 假设 或 原 假设 , 也 有 称 为 零 假 设 、 解 消 
假设 的 . 命题 互 的 确切 含义 是 .存在 一 个 G66E Oa 使 总 的 分 布 为 
了 Jo,， 记 Bx 一 日 -On, 则 命题 .9E€EOGx 称 为 是 的 对 立 假设 ,也 有 
称 为 备 选 假设 的 , 表述 

H.0EQnOR.0EOr (3.32) 
称 为 一 个 假设 窒 验 问题 ， 其 意义 是 ; 根据 样本 宛 的 具体 值 ,， 去 判 
断 互 是否 正确 ，、 或 者 说 , 在 吾 和 长 中 选择 一 个 , 分 别称 为 接受 
及 和 否定 及 (也 称 为 拒绝 五 ). 

关于 原 假 设 的 含义 , 与 Fisher 的 提 法 并 无 不 同 . 但 这 里 明确 
提出 了 对 立 假 设 ， 这 看 来 是 一 件 一 日 了 然 的 事 , 但 以 后 将 看 到 , 正 
是 由 于 明确 了 这 个 提 法 ， 就 有 可 能 补足 机 sher 理论 中 的 一 个 空 
白 , 即 可 以 对 同一 假设 的 不 同 检 验 的 优 劣 进行 比较 . 

这 里 的 提 法 , 是 已 经 把 实际 问题 数学 化 了 .。 如 果 一 开始 问题 
并 不 是 这 样 数学 化 了 (和 象 例 3.2, 3.3), 则 必须 先 做 这 一 步 。 这 往 
往 涉 及 对 具体 问题 中 一 些 提 法 如 何 解 释 , 不 一 定 是 很 容易 的 。 观 
察 以 下 的 例子 可 知 . 

例 3.7 考虑 例 3.2， 以 环 记 该 女士 说 对 的 杯 数 . 前 已 指 
出 ,在 互 ( 该 女士 无 鉴别 力 ) 成 立 之 下 , 和 不 有 超 几 何 分 布 


P(x AL 5 一 0 1， …, 4 
(3.33) 


但 什么 是 对 立 假设 ? 在 对 立 假设 下 去 的 分 布 如 何 ? 这 就 取决 于 对 
“该 女士 有 鉴别 力 ” 一 语 作 何 解释 ， 一 种 合理 的 解释 如 下 : 以 pi 记 
生 一 的 概率 ， 当 该 女士 有 鉴别 力 时 , 相对 于 (3.33) 而 言 ， 对 较 大 
的 Pi 应 较 大 些 ， 这 条 件 可 表 为 

.417 。 


4 /4 4 8 
pr 过 宛 j 4 一 / / 4 


对 5 一 41, 2, 3, 4 且 不 等 号 至 少 对 一 个 二 成 立 . (3.34) 

这 样 就 确定 了 对 立 假设 下 了 的 分 布 族 . 基 的 分 布 族 可 视 为 依赖 
和 4 个 参数 pi,…, pr( 它 们 的 和 不 超过 1)， 当 然 ， 也 可 以 有 别 的 解 
释 ， 比 方 说 , 若 该 女士 无 鉴别 力 ， 则 应 有 如 X= 二 2。， 在 她 有 鉴别 力 
时 ,平均 说 对 杯 数 大 于 2: >2， 把 满足 后 一 条 件 的 分 布 算 作对 
立 假设 中 . 

例 3.8 考虑 例 383.8， 本 例 原 假设 和 对 立 假设 的 确切 提 法 都 
不 容易 

把 15 块 地 编号 : 1, 2, …, 15. 第 纪 块 分 成 两 小 块 , 其 条 件 有 
些 差 别 ， 可 以 把 这 个 差别 表示 为 ; 在 其 他 条 件 一 样 的 情况 下 , 一 小 
块 单位 面积 产量 比 男 一 小 块 多 ci。 又 以 c 记 由 于 处 理 4、 互 的 不 
同 而 带 来 的 单位 面积 产量 差 (c>0 家 示 44 优 于 B)， 仍 以 王 记 
之 (4 一 B) 如 例 3.3, 则 子 的 分 布 为 ?以 2-5 的 概率 取 15c 土 cy 土 0 
士 … 土 c1s 中 的 每 一 个 值 ， 这 个 分 布 旗 包 含 16 个 参数 0, cz 
c15。 原 假设 为 AH. c=0, CT 和" C15 任意 ， 对 立 假 设 为 kK.c#*0, Cly 
… ,015 任意. 

男 一 种 定神 型 的 方法 如 下 ， 假 定 每 块 内 的 两 小 块 地 力 条 件 足 
够 均匀 。 但 有 些 随机 因素 影响 产量 , 如 耕作 者 在 各 小 块 上 的 操作 
不 能 完全 一 样 , 气候 因素 对 每 小 块 的 影响 也 不 完全 一 致 等 ， 仍 以 
2 记 由 于 4.B 不 同 所 导致 的 单位 面积 产量 差 , 则 第 i 小 块 上 观察 
到 的 于 :一 (4 一 BB) 可 表 为 ec 十 6 的 形式 ,6 是 由 上 述 随机 因素 所 导 
致 的 误差 .假定 6 服从 均值 为 0 的 正 态 分 布 ， 则 样本 及,…， 子 。 
独立 , 各 有 分 布 W(c, o”), 原 假设 为 妃 : 6 一 0, o>>0 任意 , 对 立 假 
设 为 ,c 关 0, o>0 任 意 , 由 于 出 发 点 不 同 ,所 导致 的 模型 也 就 有 
根本 差别 .在 前 一 种 提 法 中 ,我 们 不 要 求 两 小 块 条 件 很 一 致 ,但 要 
求 其 他 随机 因素 的 影响 可 忽略 不 计 ， 数 据 的 随机 性 纯 由 每 块 内 两 
小 块 的 随机 分 配 而 来 .在 后 一 提 法 下 , 由 于 假定 了 两 小 块 条 件 很 均 

1) 为 方便 计 , 就 设 每 小 块 面积 为 一 单位 。 
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名 ,它们 的 分 配 已 不 起 什么 作用 。， 数据 随机 性 来 源 于 其 他 随机 因 
素 . 

在 确定 原 假 设 和 对 立 假设 时 ， 要 充分 考虑 和 利用 已 知 的 背景 
知识 , 如 把 一 物件 在 天 平 上 秤 次 得 也 ,，…, XY。, 用 以 检验 该 物件 
重量 是 否 为 1， 设 天 平 的 随机 误差 服从 正 态 分 布 入 (0, o”)， 车 
对 天 平 精度 无 所 知 ， 则 检验 问题 为 X1,…，X。~N (a, 0o”), 五 
4 一 1(o 任意 ) KR aol(o 任意 )， 著 已 知 天 平 精度 , 则 可 认为 o 
已 知 , 例如 o 一 0.1, 则 检验 问题 为 且 ,…, 且 ,~ 和 YC&, 0.01), 荆 ， 
0 一 1 玉 : g#1， 又 如 在 $3.2 (三 ) 的 独立 性 za 检验 问题 中 ， 若 
事先 对 指标 4、.B 相关 的 可 能 情况 无 所 知 ， 则 只 能 以 一 切 不 满足 
(3.20) 的 情况 为 对 立 假设 ,但 往往 事先 对 相关 的 可 能 情况 有 所 知 ， 
例如 ， 著 不 独立 ， 则 必 是 正 相关 ， 一 个 实例 是 吸烟 与 患 肺癌 的 关 
系 ， 二 者 或 者 无 关 ， 如 有 关 , 则 必 是 吸烟 使 患 肺癌 的 可 能 性 增 大 . 
这 时 对 立 假设 就 有 所 限制 , 例如 , 反映 正 相关 的 一 种 提 法 是 ( 仍 用 
$ 3.2( 三 ) 的 记号 ) 


8 外 
,当时 对 和 二 ss 有 >2 Po Pro, 


且 不 等 号 至 少 对 一 组 i<i 及 某 个 了 成 立 。 针 对 这 种 较 确 定 的 五， 
可 以 提出 比 §$ 3.2( 三 ) 中 的 办 法 更 为 有 效 的 检验 方法 。 


(二 ) 否 定 域 , 检验 函数 
设 给 了 假设 检验 问题 (3.82). 这 问题 (或 者 说 假设 五 ) 的 一 
个 检验 , 就 是 一 个 这 样 的 法 则 : 一 旦 有 了 具体 的 样本 , 由 该 法 则 就 
可 决定 是 应 接受 五 还 是 否定 五 ， 这 样 ， 一 个 检验 等 价 于 把 样本 
空间 多 分 解 为 两 个 不 相交 的 部 分 4+ 和 光 。， 使 当 样 本 属于 沟 
时 接受 瑟 , 属于 4 时 和 否定 是， 人 923 称 为 该 检验 的 否定 域 ， 也 有 称 
临界 域 的 ， 作 1 则 称 为 接受 域 . 
例如 ,在 例 3.1 中, 一 个 合理 的 检验 是 有 否定 域 {了 >c}, ec 之 
值 由 买卖 双方 协商 定之 , 例 3.2 中 ,可 以 取 以 {4} 为 否定 域 的 检验 ， 
例 3.3 的 检验 的 否定 域 的 仔细 措 述 较 复杂 些 ， 留 给 读者 作为 -~ 个 
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在 有 些 情 况 下 ， 当 样本 取 某 些 值 时， 不 是 立即 接受 或 否定 
如 ,而 是 规定 一 个 与 z 有 关 的 概率 p(z)， 再 设计 一 个 试验 , 使 其 
中 某 事件 4 出 现 的 概率 为 gCw)( 例 如, 取 一 个 [0, 各 区 间 均 匀 随 
机 数 &， 定 义 4 为 “0<E<p(z)”). 具体 作 这 个 试验 ， 若 4 发 生 
了 , 则 否定 吾 。 不 然 就 接受 瑟 ， 如 在 例 3.1 中 ,买卖 双方 协商 同 
意 : 若 号 >e 则 买方 拒 收 (否定 pP 和 2) , 若 室 <e 则 接收 当 储 =e 
时 ,卖方 觉得 若 规定 拒 收 , 则 拒 收 可 能 性 过 大 ; 若 规 定 接受 , 则 买方 
觉得 , 接收 不 合格 产品 批 的 可 能 性 过 大 ， 于 是 双方 同意 定 下 一 个 
数 p(c), 规定 当 总 一 e 时 以 概率 2(c) 拒 收 该 批 产品 。 

这 样 , 可 以 把 “检验 的 概念 推广 为 : 检验 是 一 个 定义 在 样本 空 
间作 上 的 、 到 值 于 [0, 本 区 间 的 函数 pg(z)、 p(w) 是 当 有 了 样本 
% 时 ， 否 定 五 的 概率 ， 它 称 为 检验 函数 .有 了 样本 ww 后 , 先 算 出 
p(z)。 若 V(o) 一 11， 则 否定 互 ; 若 p(%) 一 0， 则 接受 吾 . 若 0< 
9(z) 二 1， 则 还 要 安排 一 个 随机 试验 ， 使 其 中 某 事件 4 的 概率 为 
p(z)。， 视 事件 4 是 否 发 生 ， 决 定 否定 或 接受 如 。 名 检验 责 数 p 
只 取 0.1 为 值 , 则 它 称 为 非 随 机 检验 , 否定 域 就 是 {2. p(w) 一 1}. 若 
对 某 些 2 有 0<p(zc)<1, 则 2 称 为 随机 检验 . 因为, 为 实施 这 检 
验 , 除 取得 样本 > 外, 有 时 还 有 必要 再 作 一 个 随机 试验 . 

随机 检验 在 实际 中 不 常用 , 但 在 理论 上 有 一 定 的 重要 性 。 即 
使 在 实用 问题 中 , 随机 检验 有 时 也 有 其 用 处 , 如 上 文 所 述 例 3.1 的 
情况 . 


(三 ) 两 类 错误 与 功效 函数 

在 检验 假设 时 ， 可 能 会 发 生 所 作 决 定 与 真实 情况 不 符 而 产生 
错误 。 错 误 有 两 类 : 一 是 互 真确 但 被 否定 了 , 称 为 第 一 类 错误 ( 充 
真 ); 二 是 五 不 真 但 被 接受 了 ， 称 为 第 二 类 错误 ( 采 伪 )。 如 在 例 
3.1， 第 一 类 错误 是 拒 收 合格 批 , 第 二 类 错误 是 接受 不 合格 
批 . 

是 否 犯 某 一 类 错误 ， 犯 错误 可 能 性 大 小 ,取决 于 参数 8 的 值 ， 
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所 用 的 检验 和 记得 到 的 样本 w。 我 们 不 能 要 求 一 个 检验 方法 永远 
不 会 出 错 , 但 可 以 要 求 尽 可 能 使 犯错 误 的 概率 小 一 些 . 
为 描述 这 个 问题 , 要 引进 下 面 的 重要 概念 . 
定义 3.23 设 g 是 (3.32) 的 一 个 检验 函数 , 则 
B.(0) 一 Pe( 用 检验 4 否定 了 H)=Bop(X), 8E@ 
(3.35) 
称 为 g 的 功效 函数 ， 也 有 称 效 函数 、 势 函数 的 ， 若 9 为 非 卫 机 检 
验 , 其 否定 域 为 25, 则 
Bo(0) = P(XER;) (3.86) 
功效 函数 就 是 当 样 本 分 布 参 数 等 于 0 时， 假设 互 被 否定 的 概率 ， 
就 例 3.1 而 言 ,车 采用 检验 
p(T) =1 Ww>e, (7)=—=0 Biro, pc) =y, (3.37) 
则 其 功效 函数 为 
BaP) -> ( 1 )za 一 2D)" 十 "|( , ) Pl p)"™, 
0<p<1. 《3.38) 
知道 了 一 个 检验 2 的 功效 函数 6。.(0)， 就 可 算出 它 犯 各 类 错 
误 的 概率 . 
、 80, 当 OEGr， 
犯 第 一 类 错误 的 概率 = 和“ ' 当 gcEe 
、 0 ， 当 0OEGr， 
Pp 犯 第 二 类 错误 的 概率 -| ，_ 0) oOCe 
例如 , 当 0Eer 时 ,五 本 来 就 成 立 , 当然 不 可 能 发 生 采 伪 ( 第 二 类 ) 
错误 。 应 当 注意 的 是 ， 一 个 检验 犯 某 一 类 错误 的 概率 不 是 一 个 党 
数 ， 而 是 依赖 于 样本 分 布 的 参数， 


(3.39) 


(四 ) 检验 的 水 平 、 真 实 水 平 、 限 定 第 一 类 错误 概率 的 原则 
设 g 是 (3.32) 的 一 个 检验 ,而 0<a<1. 
定义 8.8 若 g 犯 第 一 类 错误 的 概率 总 不 超过 a( 不 论 9 在 如 
内 取 何 值 总 不 超过 a)， 则 称 a 是 检验 g 的 一 个 水 平 , 而 9 称 为 水 
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平 w 检验 . 
由 (3.39) 立 知 , 9 为 水 平 x 检验 的 充 要 条 件 是 
But) Eo0, YO0EOR. (3.40) 

按 这 个 定义 ,一 个 检验 的 水 平 不 唯一 : 若 wK 是 检验 2 的 水 平 而 
aa<w < 和 1 则 cx 也 是 检验 g 的 水 平 。 为 免除 这 种 不 方便 ,有 时 称 一 
检验 的 最 小 水 平 为 其 真实 水 平 ， 显然 

2 的 真实 水 平 =suL 035(90):0 E60}. (3.41) 

水 平 这 个 概念 的 产生 ， 导 源 了 于 Neyman-Pearson 提出 的 一 个 
重要 原则 一 一 限定 第 一 类 错误 概率 的 原则 , 按照 (3.39), 一 个 好 的 
检验 应 使 其 功效 函数 在 @z 上 取 小 值 , 而 在 Bz 上 了 大 值 .， 这 一 反 
不 能 随心 所 欲 地 达到 : 为 使 B60) 在 909E Br 时 小 ,就 要 少 否 定 已， 
划 要 把 省 定 域 取得 小 一 些 ,而 这 也 就 会 使 B06) 在 gr 上 跟着 也 四 、 
了 。 反 过 来 也 一 样 .为 解决 这 个 困难 , Neyman-Pearson 提出 : 指 
定 o, 0<aw<1I， 限 制 所 用 的 检验 有 水 平 w， 即 其 第 一 类 错误 概率 
总 不 超过 c， 在 这 个 限制 之 下 谋求 使 第 二 类 错误 概率 尽 可 能 小 . 
这 样 ，Neyman-Pearson 就 得 以 把 假设 检验 问题 提成 一 个 明确 的 
数学 最 优化 问题 ， 在 约束 条 件 “B65(90)<<a 当 09EOn 之 下 ， 使 
Bo(9) 在 @rk 上 尽 可 能 大 ”。 怎么 叫做 “ 尽 可 能 大 ”? 这 句 话 可 赋予 
种 种 意义 , 而 这 就 引出 一 些 最 优化 准则 ， 怎样 制定 各 种 合理 的 准 
则 , 并 在 这 些 准 则 之 下 找 出 最 优 的 检验 ,就 成 为 NE 理论 的 中 心 内 
容 、 

至 于 水 平 a 的 选择 , 习惯 上 一 般 是 把 取得 比较 小 且 标 准 化 . 
例如 a=0.001, 0.005, 0.01, 0.05, 0.1 等 值 ， 而 不 取 0.0412 这 
种 值 。 标 准 化 是 为 了 造 表 方便 .至 于 a 习惯 上 取 小 值 ， 是 因为 在 
应 用 上 有 这 样 一 类 问题 , 其 中 原 假 设 代表 一 种 久 已 存在 的 状态 (如 
一 种 已 用 了 多 时 的 生产 方法 )， 而 对 立 假设 则 反映 一 种 改变 (如 一 
种 刚 提出 而 未 经 实践 考验 过 的 新 生产 方法 ), 把 wx 取得 很 小 使 弃 真 
错误 概率 很 小 ， 因 此 ,一 旦 检验 的 结果 是 否定 原 假设 ( 妈 改 用 新 生 
产 方法 )， 那 一 定 是 有 充分 的 根据 ， 这 反映 了 应 用 者 这 样 一 种 心 
理 , 除非 证 据 很 有 说 服 力 ,不 轻易 改变 现 有 状态 而 投入 那 种 未 经 考 
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验 过 的 、 其 后 果 难 于 估计 的 新 状态 中 去 .当然 , 在 一 具体 问题 中 ， 
当 两 类 错误 的 后 果 已 有 了 明确 估计 时 , w 究竟 取 多 大 为 好 , 可 根据 
这 一 具体 情况 去 决定 , 而 不 一 定 拘泥 于 取 小 的 w 值 . 

以 上 所 述 就 是 NP 理论 的 要 民 ， 我 们 特别 强调 的 是 ， 这 个 理 
论 角 确 和 新 提出 了 一 系列 的 严格 数学 概念 ， 尤 其 是 把 检验 问题 提 
成 了 一 个 数学 最 优化 的 问题 ， 第 五 章 将 介绍 的 Wald 判决 函数 理 
论 又 沿 着 这 个 方向 作 了 发 展 ， 所 以 有 人 认为 ，NP 理论 是 Wald 
理论 的 先 声 . 

拿 NP 理论 与 Fisher 的 工作 比较 , 可 以 看 出 , 诸如 原 假设 、 否 
定 域 、 第 一 类 错误 和 水 平等 概念 , 在 Fisher 的 工作 中 也 提出 或 隐 
食 了 ， 在 例 32.2、 例 3.38 和 玉 . Pearson x? 检验 中 所 提 到 的 “ 阐 
值 ”a, 实际 上 就 是 NP 理论 中 检验 的 水 平 ， 他 们 用 这 个 阐 值 a 保 
证 了 : 当 使 用 该 检验 时 , 原 假 设 被 错误 地 否定 的 机 会 只 有 a， 但 这 
样 的 检验 很 多 ， 用 什么 标准 比较 其 优 劣 ? Fisher 由 于 六 明确 提出 
对 立 假设 这 个 概念 , 也 就 不 可 能 提出 第 二 种 错误 概率 ,而 使 他 的 工 
作 中 缺少 了 这 个 关键 之 点 。NP 理论 补足 了 这 一 点 。 至 此 可 以 看 
出 ， 如 我 们 在 前 面 曾 提 到 的 ， 尽 管 对 立 假 设 这 个 概念 看 来 一 是 了 
然 , 它 的 明确 提出 有 重大 意义 。 


$ 3.4 一 致 最 优 检验 与 无 偏 检验 


(一 ) 一致 最 优 检 验 ”你 eyman-Eearson 基本 引 理 
” 设 有 检验 问题 (3.32), 指定 a, 0<a<1l, 以 Bo 记 (3.82) 的 一 
切 水 平 a 检 验 的 集 . 
定义 838.4 若 pEG。, 且 对 任何 p1:EBo 有 
Be()>B».(0), B OE Or, (3.42) 
则 称 9 为 (3.32) 的 一 个 水 平 的 一 致 最 优 检 验 ， 简 称 水 平 a 的 
UMP 检验 (UMP 是 Uniformly Mosi Powerful 的 缩写 )， 
按 (3.89), 当 zp 为 水 平 a 的 UMP 检验 时 , 它 在 限制 第 一 类 错 
误 概率 不 超过 a 的 条 件 下 ， 总 使 ( 即 对 一 切 9E Bz) 第 二 类 错误 概 
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率 达 到 最 小 。 因 此 ,车 以 错误 概率 为 衡量 检验 优 劣 的 唯一 尺度 , 且 
接受 限制 第 一 类 错误 概率 的 原则 , 则 UMP 检验 是 最 好 的 检验 , 不 
过 , UMP 检验 的 存在 一 般 是 例外 而 不 是 常见 。 理由 如 下 ， 车 Gr 
不 止 包 含 一 点 (这 时 它 称 为 复合 的 。 若 只 会 一 个 点 则 称 为 简单 
的 )， 则 当 在 其 中 取 两 个 不 同 点 信和 bs 时 , 为 使 Bs(91) 尽 可 能 大 
的 那 种 检验 p, 不 见得 同时 也 能 使 8,(0s) 大 ， 如 在 $3.2( 三 ) 独 立 
性 检验 中 , 对 立 假设 可 以 是 正 相关 也 可 以 是 负 相 关 。 一 个 针对 前 
者 的 检验 , 对 后 者 的 功效 就 很 低 。 在 这 种 情况 下 ，UMP 检验 不 可 
能 存在 . 

在 @r 只 包含 一 个 点 时 ， 一 般 来 说 UMP 检验 存在 . 但 确定 
这 个 UMP 检验 也 不 易 ， 只 有 在 @r 和 Bx 都 只 包含 一 个 点 时 ， 问 
题 很 简单 . 

定理 3.3(NP 基本 引 理 ) 设 样本 及 的 分 布 有 概率 函数 
f(z, 0)， 参数 9 只 有 两 个 可 能 值 go.0:， 则 对 任 给 wE (0, 1 存在 
常数 O 和 7E [0, ,使 由 下 式 决 定 的 检验 函数 ps 是 检验 问题 


H:0=000K :0~=01 (3.43) 
的 水 平 a 的 UMP 检验 ， z 
i, >0O; 
Ya (%) -| 7， 当 了 Ca， 01)/f (%, go) 一 Ci; (3 .44) 
0 <0O., 


2 


证 以 及 记 当 0 一 0 时， 变量 A( 子 , 0) 大王, 0o) 的 分 布 函 

数 ， 由 于 0<a<1, 存在 0, 使 AO)<<1 一 a<hCO+0) (我 们 采用 

左 连续 的 分 布 )， 车 MO) 一 1 一 o 取 7= 刁 若 AOT+TO) 一 1 一 o 取 

7=0; 车 O)<1 一 a<h(0O+0), 则 取 y 玉 (0O-+0) 一 (1 一 0) 3/ 
以 (C+0) 一 (0)], 显然 ,这 样 选择 的 O 和 Y 满足 条 件 

BopaX)—1—h(O+O0)TF YI NOT+O0) ~—hO) =o, 

: (3.45) 

即 ps 确 有 水 平 a。 现 设 p 为 (3.48) 的 任 一 水 平 o 检验 , 并 为 确 害 

计 设 f(z, 9) 是 样本 于 的 密度 , 定义 样本 空间 的 子 集 57 一 {z: 

pal2)> gp(2)}, 人 -一 {z:pa(z)<pLZ)。 在 ER 时 guo 一 0D， 


sj24。 


由 (3.44) 知 f(w, 01)/f(z, go0)>>C. 在 zES 时 有 pu(z)<1， 由 
{8.44) 知 f(z, 91)/f《w, 0o)<<CO， 由 此 可 知 ,在 整个 样本 空间 上 有 
[po(o) 一 pc)] [Lo 1) — Of (rz, 00)] 守 0, 因 此 


| ,fp:(%) —p(2)I Ef, 01) -Of(%, bo]az>0， 
妈 


| gao)f le, Gd -| pw)f la, 0 dw 


>0|[ | wa)f Cs, go)az-| (ze go)da， 


(3.46) 
易 见 O>0， 事 实 上 , 若 O<0, 则 因 概 率 函 数 不 取 负 全 ,由 (8.4 
知 go= 工 于 和 上 ,这 与 wo 有 水 平 < 矛盾 ， 其 次 , 由 (3. 全 ) 得 
jweCoy7(cbo)az=w 又 因 史 有 水 平 % 知 | pC2)f(%, bo do 
由 此 知 (3.46) 式 右边 非 负 , 故 
Bo.(0) =| pelo) fw, bdz> | po)f ls, 01) de 
= Bo(01). 1 

这 证 明了 we 为 水 平 “的 UMP 检验 ， 定 理 证 毕 ， 

从 “ 似 然 性 "的 观点 去 看 NP 基本 引 理 是 很 清楚 的 ， 对 每 个 术 
本 an， 0: 和 bo 的 “ 似 然 度 " 分 别 为 Ka， 9) 和 J(a, 0o)， 比 信 fu， 
91)/f(z, 00) 僵 大 ， 就 反映 在 得 到 祥 本 2 时 ,9 剑 像 是 0 而 非 0o 
这 样 的 就 愈 应 倾向 于 否定 9 一 9。 的 假设 . 

从 NP 基本 引 理 还 看 出 随 宙 检 验 的 作用 。 若 局 限于 非 随机 检 
验 , 则 对 某 些 w 我 们 可 能 无 法 找到 一 个 检验 ， 其 真实 水 平 从 为 x 
( 即 , 不 一 定 存在 O, 使 MKO) 一 “或 WO-0) 一)， 这 时 水 平 a 的 
UMP ( 非 随 机 ) 检 验 就 可 能 不 存在 . 


(二 ) NP 引 理 用 于 求 UME 检验 
er 和 Bx 都 只 包含 一 点 的 这 种 情况 在 应 用 上 人 少见， 故 作为 一 
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个 求 UMP 检验 的 方法 , NP 基本 引 理 的 直接 意义 不 大 。 但是, 通 
过 这 个 基本 引 理 , 可 以 求 得 其 些 当 见 的 检验 问题 的 UMP 检验 , 其 
中 Qn 和 OBE 不止 包含 一 个 点 . 

在 Gx 中 挑 出 一 个 点 bo 尽量 接近 Bz， 在 Bx 中 任 取 一 点 内， 
构成 检验 问题 (3.48).， 按 NP 基本 引 理 ， 可 求 得 这 问题 的 UMP 
检验 pue。 一 般 , 当 岂 在 @r 内 变化 时 , pa,o, 也 会 随 之 而 变 ， 现 
假定 pue, 不 依赖 于 凡 , 即 不 论 由 在 Bk 内 如 何 变化 ,pouo 总 等 于 
一 个 固定 的 检验 函数 g。 车 再 假定 pu 作为 (3.32) 的 检验 有 水 平 
o 则 它 就 是 (3.32) 的 水 平 w 的 UMP 检验 . 

事实 上 , 任 取 \3.32) 的 一 个 水 平 % 检验 并 设 六 Eer. 关 9 
为 (3.32) 的 水 平 a 检验， 自然 有 B。(go) 生 w。 因此 9 也 是 (3.48) 
的 水 平 a 检验, 但 pe 是 (3.48) 的 水 平 a 的 UMP 检验 , 故 B。.(01) 
减 Bob 由 于 由 是 在 @r 内 任 取 的 ,证 明了 所 要 的 结果 . 

当然 , 此 法 要 行 得 通 并 不 容易 , 即使 (3.82) 的 UMP 检验 果真 
存在 , 也 不 一 定 能 找到 具有 上 述 性 质 的 名 .。 具有 在 参数 空间 台 是 
一 维 的 (BR* .其 一 区 闻 ), 而 假设 是 单 边 的 . 


H.0<000K.0>0,, (3.47) 
且 样 本 又 的 分 布 为 指数 型 , 即 其 概率 河 数 为 
fw, 0) =O0(0)0 Th (wy). (83.48) 


其 中 0(0)、.Q(9) 只 是 6 的 丽 数 ,T(z)、h(w) 只 是 样本 2 的 函数 ,上 且 
8(0) 为 8 的 严格 增加 注 数 之 时 , UMP 检 验 必 存 在 . 这 就 是 下 面 
的 重要 定理 : 
定理 3.4 设 样本 下 的 分 布 为 指数 型 (3.48), 日 为 (一 
o0) 的 一 有 限 或 无 限 区 间 , 为 的 一 个 内 点 ， 且 Q(49) 为 8 的 严 
增 函 数 ， 则 检验 问题 (8.47) 的 水 平 a 的 UMP 检验 存 在 \0<“< 
1), 且 有 形式 : 
工 ， >0; 


-1 当 < (2)—0; (3.49) 
0， <0. 
其 中 常数 O 和 7(0<7<1) 满 足 条 件 
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”和 L 


P, (T(X)>O)+yPs (TI) 一 O)] 一 w (3.50) 
证 任 取 人 外 >>0o, 构成 检验 问题 (3.48), 有 


fo, 01)/f (2, 00) ~ GI xP LT (2) QO) ~ QC60))]. 


出 于 Q( 扑 ) 一 Q(83;.>0, 且 CC0 0 >>0， 上 式 右边 为 工 (w) 的 
民 增 沙 数 ， 因此, 比 作 了 (zw, 91)/f(w, 00) 大 于 、 等 于 或 小 于 某 一 常 
数 O'， 分 别 相应 于 (2) 大 于 、 等 于 或 小 于 某 一 常数 QO， 由 此 及 
NP 基本 引 理 , 知 (3.48) 的 水 平 a 的 UMP 检验 有 形式 (3.49), 其 
中 CO 和 由 (3.50) 确 定 。 由 于 CO 和 与 多 无关， 根据 前 面 的 讨 
论 知 ， 为 了 证 明 由 (3. 和 9) 和 (3.50) 确 定 的 检验 og 是 .3.47) 的 水 平 
0 的 UMP 检验 , 只 须 证 明 . 2 是 (3.47) 的 水 平 wx 检验 ， 显然 , 欲 
证 明 这 一 点 , 只 须 证 明 , wp 的 功效 函数 B89) 是 8 的 非 降 函 数 。 下 
面 来 证 明 这 一 点 . 
任 取 天 入 ,由 (3.48) 知 


Fo 9)/f(%, 0") ~ ErgrexpLCQCO) -9000)7(o)] 
因为 Q@ 为 6 的 严格 增加 画 数 , 且 9'<9", 有 Q(9”) -QC9") <0. 又 


Of 的 >>0， 0(9”)>>0， 由 此 知 f(w, 8)/f(w, 8”) 只 与 T(w) 有 关 ， 
且 是 了 (4) 的 严格 下 隆 函 数 ， 找 如, 使 

A xpLCQO) -QO i =l. 

这 栏 的 刀 必 存 在 , 否则 恒 有 f(xw, 9 < 之 f(w, 9”) 或 f(w,0”)>>f(z, 
9"), 这 与 | Fa， 9)ae—| flw, 0av 一 1 荐 盾 ， 令 


Si= {2:T(%)>to}, Ss = {2:T (2)<to}, 
Ss= {2:T(%)=—to}, 


则 由 | f(z, gaz= | f(z, 9 dc 十 以 及 如 的 定义 , 易 知 
0o<| [re 0”)—f(%, 0)1de 
-一 | [Go 0")—f(e, 90]az 
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由 (3.49) 知 ，g(z) 只 与 了 T(z) 有关 ， 且 是 人 T(x) 的 非 降 函数 ， 故 有 
inf ?2)>sup p(wm)， 因 此 
B.C0") —B,(0') = | po TFL, 0 一 Fo 0)] de 
~ | po) [fo 0") —f i%, 0)Jds 


+ pw) [fo bg 一 fo bg)]do 


> Linf 9(%) —sup (2)] 


xj Tf, 0") fw, 0) Jdw>0. 
这 证 明了 Bs(0)<<B,(0")， 即 8B.(0) 非 降 ， 因 而 完成 了 定理 的 证 
明 . z 
完全 同样 的 方法 证 明 ; 车 考虑 检验 问题 
H.0>000FE. 0<, 
则 对 任 给 的 wE (0, 1), 水平 a 的 UMP 检验 存在 , 而 且 有 形式 
1, <0., 


px(z) -| 7， 当 T(z) 一 0O; (3.51) 

0， >0. 
其 中 常数 OO 和 7C0<y<1) 满 足 条 件 
PalT(R)<O)+7Po(T(X)=0) a, (3.52) 


例 3.9 考虑 例 8.1， 此 处 双 一 {0, 1,…, nn}, @={p: 0< 
p<1} ,有 f(%, 四 -人 (1 一 p)"*， 可 写 为 (1 一 p)"exp [zx 


log 了 2 二 | 8(D) ~log 了 2 在 09<p<1 时 严 增 ,Te) 一 2 故 定理 
3.4 的 条 件 全 满足 ， 因 而 问题 了 ; p<pYK;p>p 的 水 平 。 的 
UMP 检验 p 存 在 ， 且 有 (3.37) 的 形式 ， 其 中 0 和 由 (3.38) 决 
定 . 

本 例 中 参数 空间 可 取 为 {p: 0<p<1}. 例 中 为 了 写成 指数 型 ， 
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舍弃 掉 了 0、1 两 个 极端 值 ,不 难 证 明 : 即使 保留 这 两 个 值 ， 例 中 的 
结果 仍 成 立 , 这 留 给 读者 作为 一 个 练习 ， 

例 3.10 设 全 1 "yy X.~N(D, aa)， Uo 已 知 ， 要 检验 假设 
H:0<0COK:0>0 有 z 

fm mv 0) — (2rod) "oxp| — Ls Sm, 0)°]| 


200 行 


-= (D086) "0 "0 “toxp| 一 95 | 
Oo 


xexp(— 1 Se). (3.53) 


2c0 
这 是 (3.48) 的 形状 , 其 中 QC0) 一 9/o3 严 增 , 了 (o) 一 2 一 二 疝 


(% 一 (m4, …, 4m))。 据 定理 3.4, 知 水 平 a 的 UMP 检验 存在 , 且 
有 否定 城 全 >0}, 常数 0 由 Po( 肝 >>0) 一 «决定, 易 见 O 一 oows/ 
wm ,其 中 wu 由 条 件 
1 

M2 

决定 , 可 由 正 态 分 布 表 查 出 ， 本 例 所 以 UMP 检验 为 非 随机 的 , 是 

因为 到 的 分 布 为 连续 型 ， 它 取 单 个 值 的 概率 为 0， 在 连续 型 分 布 
中 多 是 这 种 情况 . 

男 有 儿 个 可 崇 为 单 参 数 指数 型 分 布 族 的 重要 情况 ， 留 作为 习 

题 . 也 有 个 别 非 指数 型 的 情况 ，UMBP 检验 也 存在 . 一 个 重要 例子 

是 习题 3. 至 于 在 多 参数 的 情况 , UMP 检验 的 存在 就 是 很 稀有 的 

例外 了 .、 有 一 个 重要 例子 是 美国 统计 学 家 卫 . L. Lebhmann 和 人 C. 

Stein 在 1948 年 得 到 的 ， 设 也,…:, 了 ~ 入 (ga, o?), go 都 未 知 
(两 参数 ), 要 检验 

五 :co 和 co wu 任意 全 :>>ao 4 任意 . (3.55) 


他 们 证 明了 : (3.55) 的 水 平 a 的 UMP 检 验 存在 , 且 有 和 否定 域 
{Gu mr) : 袜 (mi 一 总 )*>cix3-:(c)}， 但 这 个 结果 不 能 用 本 节 
的 方法 证 明 ， 


| e-P/2 玉 一 (3.54) 
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(三 ) 无 偏 检验 ”一 致 最 优 无 偏 检 验 

前 已 说 明 , UMP 检验 的 存在 是 少 有 的 例外 。 因此 ， 作 为 一 个 
准则 , 它 的 实际 效用 是 很 有 限 的 .为 了 得 到 适用 范围 更 大 的 准则 ， 
有 两 个 途径 可 以 采取 . 共 一 是 引进 一 种 综合 性 的 指标 . 就 是 说 ， 
对 (3.32) 的 每 一 个 检验 gw， 定义 一 个 数量 指标 一 (pj)， 若 四 ，9a 
是 (8.32) 的 两 个 检验 , 则 当 Wo) >>M(Cops) 时 ， 称 gi 优 于 psa. 若 
M(g) 宇 M(p1) 对 任 一 检验 pr， 则 称 p 在 准则 履 之 下 为 最 优 的 .也 
可 以 先 指定 一 个 a 在 一 切 水 平 为 a 的 检验 中 ,去 寻找 按 准 则 几 为 
最 优 的 检验 .。 另 一 个 途径 是 先 对 所 考虑 的 检验 施加 菜 种 合理 的 、 
一 般 性 的 限制 , 这样 就 缩小 了 所 考虑 的 检验 的 范围 ,然后 在 这 六 小 
了 的 范围 内 去 寻找 一 致 最 优 的 检验 . 正如 在 点 估计 中 , 我 们 先 限 
制 估 计量 必须 是 无 偏 的 , 然后 在 无 偏 信 计 类 中 ,去 寻找 在 某 一 准则 
下 最 优 的 估计 , 例如 UMVY UE. z 

这 后 一 途径 的 一 个 重要 例子 是 无 偏 检验 。 我 们 先 给 它 下 一 个 
正式 的 定义 . 

定义 3.5 设 p 为 (3.32) 的 一 个 检验 ，B6。(9) 为 其 功效 消 数 , 
车 对 任何 抽 EOp 及 05E OF, 总 有 Bol01) < Bol0s), 则 称 Wa 是 
(3.32) 的 一 个 无 偏 检 验 ， 若 无 偏 检验 gp 有 水 平 ， 则 称 9p 为 水 平 
a 的 无 偏 检 验 . 

无 偏 检 验 的 直观 意义 很 清楚 ， 若 9 为 互信 五 的 无 偏 检 验 ， 则 
当 五 正确 时 ,五 被 否定 (这 否定 是 错 的 ) 的 概率 ， 不 应 超过 当 匡 
不 正确 时 , 瑟 被 否定 (这 否定 是 对 的 ) 的 概率 .“ 无 偏 " 一 词 还 可 以 
这 样 去 理解 : 这 个 检验 考虑 到 了 对 立 假设 Bx 中 各 种 参数 值 , 不 因 
特别 “照顾 ” 某 一 部 分 参数 值 而 “ 斩 牲 " 另 一 部 分 参数 值 。 如 下 面 的 
例子 . 

例 3.11 芳 ,，…, 了 ,~ 入 (9, 1), 检 验 问 题 为 

H:0=00K:0#0. {3.56) 

取水 平 a. 若 特别 照顾 9>0 这 部 分 参数 值 ， 则 取 以 {>>us/ vn} 
为 否定 域 的 检验 最 好 .但 这 个 检验 对 0<0 的 这 部 分 对 立 假设 参 
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数 估 表现 很 差 : 其 功 六 在 这 些 避 处 小 于 水 平 % 且 当 0 > 一 co 时 趋 
于 0， 同样， 若 特别 照顾 09<0 这 部 分 参数 值 ， 则 取 以 {过 一 way 
Mn} 为 否定 域 的 检验 最 好 ， 但 它 在 对 立 假设 9>0 处 表现 很 差 . 
这 两 个 检验 都 不 是 无 偏 的 . 容易 证 明 ( 习 题 9)， 以 {| 吾 | >>ways/ 
wm +} 为 否定 域 的 检验 是 无 偏 检验 .这 个 检验 考虑 了 0 一 0 两 边 的 
参数 值 . 

任 一 检验 问题 都 存在 各 水 平 的 无 偏 检验 ， 上 比方 ,2(2) 二 a 
就 是 其 一 , 因为 其 功效 函数 在 @ 上 处 处 等 于 w。 以 Us 记 (3.32) 的 
一 切 水 平 “ 无 偏 估计 的 类 . 

定义 3.6 车 pEUDV, 且 对 任何 prEU6, 有 

Bo(0) 之 Bo,(0), 对 一 切 0€Ox, (3.57) 
则 称 g 是 (8.82) 的 一 个 水 平 o 的 一 致 最 优 无 偏 检 验 (简称 UMPU 
检验 ). 

UMPU 检验 存在 的 情况 ， 比 UMP 检验 存在 的 情况 要 广 一 
些 , 但 仍 不 是 很 广 ， 大 体 上 说 ， 只 有 在 样本 区 的 概率 函数 有 指数 
形状 (9 = (2，…，b)) 

je 0) =—0(0)oxp(S Tw)) ho). (3.58) 

而 假设 互 上 只 涉及 其 中 一 个 参数 (比方 说 0). 或 诸 参 数 的 一 个 线 

性 型 时 , UMPU 检验 才 可 能 存在 。 更 确切 地 说 ， 原 假设 苇 必须 有 

以 下 几 种 形式 之 一 ( 记 7 一 i 负 十 … 十 Gy，V1，…，Qx 为 已 知 常 
数 )， 

Hi, l=1o; Ho. Tl<lo; Hs tT>lo; Hs, UI<L. (3.59) 

有 时 , 互 的 概率 函数 不 直接 以 (3.58) 的 形式 出 现 ， 但 可 以 对 参数 

6 作 一 定 的 变换 达到 这 一 点 ， 例 如 ,和 …， wa， c)， 概率 

了 Di 0 0o)=(Vamo) "exp( — i Sw,—a)) 


oo (VvV 2z 0 ) "0" /90 


“131. 


xoxp[- 所 名 - 吉 2 训 4]. (3.60) 


以 01 一 如，0s 一 一世 5 为 新 参数 ,并 记 Ja(z) 一 2 Ta (2) ~ 


90g 


妨 台 ， 则 (8.60) 可 写 为 


f Cz1, “0 ny 2 ， 9) =—(— a) eve 


Xexp(giTa(o) 十 baTa(o))， (3.61) 
其 中 负 , 0a 变化 范围 为 - ceo<< 由 <co,， 0 <0.， 有关 a 和 o 的 一 些 
检验 问题 , 可 化 为 43.59) 的 形状 , 如: 
4 一 ao -> 信 一 20o0 一 0 CC<oo 一 0 一 2ao0<0; 
1 


1 | 22 
。 —> D< 一 一 一 
20r3 ) oO < Oo oe 203 


这 些 假设 都 可 以 找到 UMPU 检验 , 有关 定 理 的 确切 表述 及 其 严格 
数学 证 明 很 复杂 , 超出 了 基础 课 的 范围 之 外 , 故 在 此 都 从 略 了 。 有 
兴趣 的 读者 可 参看 陈 希 颖 4 数理 统计 引 论 >§ 3.3. 


032 一 0 一 0 一 一 


$3.5 似 然 比 检验 


似 然 比 检验 是 Neyman 和 Pearson 提出 的 一 种 构造 检验 的 
方法 ， 这 是 一 种 基于 直观 想法 的 方法 ， 有 如 点 估计 中 的 极 大 似 然 
估计 ， 用 这 种 方法 构造 出 来 的 检验 ,一 般 说 有 比较 良好 的 性 质 , 但 
是 并 不 能 一 般 地 证 明 ， 这 样 构造 出 的 检验 必然 满足 某 些 常见 的 最 
优 准 则 , 如 UMP 或 UMPU 之 类 ， 这 个 方法 的 一 个 优点 是 适用 面 
较 广 , 就 是 说 , 它 对 分 布 族 的 形式 没有 什么 特殊 的 要 求 . 


(一 ) 似 然 比 检验 的 定义 
定义 3.7 设 样本 子 有 概率 函数 f(z, 0)，bE6,Ba 为 @ 的 
非 空 真子 集 . 考虑 假设 检验 问题 (3.32), 则 统计 量 
Ze) 一 sj a， 0)/sup 7 0) (3.62) 
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称 为 关于 该 检验 问题 的 似 然 比 ， 而 由 下 式 定义 的 检验 函数 9 
1, >0; 
pw) -| y， 当 工 R(o) 一 Oi; (3.68) 
0， 一 0， 
其 中 O, 7 为 常数 ,0<<y<1, 称 为 (3.32) 的 一 个 似 然 比 检验 . 

当 Bz 和 Gr 都 只 包含 一 个 点 时 ， 似 然 比 检验 (3.63) 就 是 NP 
基本 引 理 中 确定 的 那 种 检验 (3.44) (严格 讲 ,这 句 话 只 在 一 定 条 件 
下 才 正 确 )， 在 $ 3.4( 一 ) 的 末尾 处 ， 我 们 曾 对 检验 (3.44) 的 直观 
根据 作 过 说 明 。 该 说 明 大 体 上 也 适用 于 似 然 比 检验 ， 有 了 样本 4 
后 , 似 然 性 最 大 的 参数 值 , 是 9 的 极 大 似 然 佑 计 和 6 一般 与 参数 
真 值 bo 应 接近 ，(3.62) 右 边 的 分 子 当然 等 于 f(w, 6)， 若 假设 五 
成 立 , 即 bo 确 在 @z 内 , 则 (8.62) 的 分 母 宇 f(w, bo) 二 Fo, 们 ,这 
时 LR(w) 接近 于 1; 反 过 来 , 若 瑟 不成立, 则 90 不 在 @r 内 , 因 6 
与 bo 接近 , 6 也 不 在 @r 内 。 这 时 (3.62) 的 分 母 将 小 于 Fo, D)， 
而 上 LR(w) 将 比较 显著 地 大 于 工 因此 反 过 来 说 , DR(z) 取 大 值 可 
以 看 作 0,EGxn, 即 玖 不 正确 的 证 据 ， 举 两 个 简单 例子 . 

例 8.12 Xi, 1, XR,~NGO, 1), HBH:0O=000OFK:0#¥0, 


给 定 ， 有 jz …， 0n， 0) ~ (2w) -rexp | -于 立 (9) 中 | 显 
见 sap job， Vn, 0)= fw "°° Vn, bo) 一 (2m) exp [ - 寺 x 
E08r 


Dl, 00)°|, supf (m1 «%, on, O) = (2 wm) "exp [- 吝 访 (wm- 
5)* |. 于 是 
LR …。 2) oxp[ CE 00)°], 
工 R(wi,，…, zr) 是 |3 一 06| 的 严格 增加 函数 .由 此 导出 似 然 比 检验 
有 否定 域 {|z 一 06| >C}(S 的 分 布 为 连续 型 , (3.63) 中 取 ?7 那 一 
栏 没有 必要 )。 OC 之 值 要 根据 检验 的 水 平 来 定 : 着 取水 平 a, 则 应 取 
GO 一 wo/ nm . 
如 果 原 假设 为 2 委 b 而 对 立 假设 为 02>0, 则 不 难 算得 
“1133 。 


了 Re »…, -| sxp[ 亏 n(z—00)?|, 当 2> 
1, 当 w<0. 
: (8.64) 
这 时 , 若 取 水 平 a<1/2( 这 是 常见 的 情况 )， 则 似 然 比 检验 将 有 雁 
定 域 {5 一 96>>wo/ Mm}， 这 个 简单 推理 留 给 读者 (习题 ), 但 若 取 
水 平 a>>1/2 而 坚持 要 用 似 然 比 检验 , 则 必须 用 如 下 的 检验 9 


、 1， 当 zw>0; (3.65) 
(ee 0 {ay je 


(习题 18) 在 前 一 情况 (< 村) 似 然 比 检验 为 UMP, 而 在 后 一 情 


况 则 否 。 在 后 一 情况 其 实 UMP 检验 仍 存 在 ( 例 3.10). 由 此 可 
见 , 似 然 比 检验 不 必 给 出 最 优 的 答 验 ， 

问题 的 症结 在 于 : 在 原 假设 为 6=0。 时 , Bz 为 零 维 集 而 @ 为 
一 维 集 ， 维 数 不 等 ;在 原 假设 为 4 和 加 时 ,@a 和 @ 同 为 一 维 集 .只 
要 Bn 与 台 的 维 数 相同 , 本 例 这 样 的 情况 在 水 平 “ 较 大 时 就 可 能 
出 现 . 不 过 这 个 现象 并 非 很 重要 : 因为 ,一 则 在 应 用 上 水 平 “ 总 取 
得 较 小 , 这 时 上 述 情况 不 大 发 生 。 二 则 即使 较 大 而 上 述 情况 发 
生 了 ， 我 们 也 可 以 参照 o 较 小 时 的 似 然 比 检验 去 修正 之 (实际 上 ， 
就 是 只 取 似 然 比 中 不 等 于 工 的 那 一 部 分 ， 把 它 看 作 是 在 整个 样本 
空间 上 都 成 立 )。 在 本 节 ( 三 ) 中 我 们 还 会 看 到 一 些 这 样 的 例子 . 

例 3.18 回 到 83.2( 一 ) 中 区 . Pearson x? 拟 合 优 度 检验 问题 
那个 最 简单 的 情况 。 这 相当 于 给 定 了 pi, …, 2r， 都 大 于 0, 其 和 
为 1 又 有 了 样本 (v1,，…, pr), 其 概率 色 布 为 Peer(za …，2r) 


一 | 7 OY Or, 要 检验 假设 H:0=ni, … 0. 一 pr， 此 处 


六 
6-to 0.):0>0， Ck > 而 Br 只 和 包含 
一 点 Lp …， pr)， 简 单 计算 给 出 : 

LR or) 一 也 志 -). (8.66) 
与 (3.9》 比 较 ,， 可 见 此 问题 的 似 然 比 检验 不 同 于 KK. Pearson 的 x? 
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检验 .但 在 样本 大 小 mn->co 时 ,在 下 一 段 中 我 们 将 指出 ,二 郑 渐 过 
地 等 价 ， 


《二 ) 似 然 比 的 渐 近 分 布 

为 了 定 出 (3.63) 中 的 C 和 ,使 它 有 给 定 的 水 平 a, 就 需要 知 
道 似 然 比 LR(Z) 在 原 假 设 成 立时 的 分 布 。 在 简单 便 子 中 , 似 然 比 
的 分 布 可 以 算出 。 但 在 多 数 和 情 帝 下 , 如 在 例 3.13, 似 然 比 有 很 复杂 
的 形状 ， 其 精确 分 布 无 法 求 得 ， 1938 年 , S. 8S. Wilks 证 明了 : 知 
样本 忌 是 独立 随机 样本 及 ,…'， 叉 ,， 则 当 样 本 大 小 m->co 时 , 在 
原 假设 成 立 之 下 ， 似 然 比 有 一 个 简单 的 极限 分 布 。 应 用 这 极限 分 
布 ,可 以 近似 地 决定 (3.68) 中 的 OC 和 7.. 

Wilks 定理 的 确切 陈述 包含 一 大 堆 关 于 总 体 的 概率 函数 的 假 
定 , 需要 两 页 纸 才 能 写 下 来 , 其 证 明 也 很 复杂 、 因 此 ， 我们 不 打算 
作 完 整 的 叙述 ， 只 指明 条 件 中 的 一 个 至 关 重 要 之 点 ， 就 是 日 的 维 
数 应 当 高 于 Ga 的 维 数 . 举例 而 言 ， 车 样本 了, …, on~N(a, 
o?), 原 假设 为 五 : 4 二 ao, 则 8@ 是 娟 中 的 上 半 平 面 {(4, 0): 一 co 
过 4 之 oo, o>0} .这 是 一 个 二 维 集 ，@n 是 @ 内 的 一 条 半 直 线 : 
On 一 {(g, 0); 4 一 m0, 0>>0， 虽 然 它 身 居 平 面 上 , 但 是 只 是 一 个 
一 维 集 。 又 如 , 三 维 空间 中 的 球面 是 二 维 集 , 球体 是 三 维 集 . 一 个 
点 是 零 维 集 , 在 例 3.13 中 ,参数 为 加, …, 0;, 但 其 和 为 1, 故 实质 
上 只 有 参数 01, 0 而 日 一 人 (0 O01): >0, 01 


邓 一 工 
>0, 之 Gi<1}. 这 是 如 司空 间 中 的 一 个 有 内 点 的 集 ,为 "一 1 维 


集 ， 本 例 的 @r 只 含 一 个 点 , 为 零 维 集 ， 明 确 了 这 一 点 ， 可 以 把 
Wilks 的 定理 大 至 地 表述 为 : 
定理 3.5 若 8 的 维 数 一 B5 的 维 数 =t>>0， 则 在 原 假设 9E 
Bn 成 立 之 下 ， 当 样本 大 小 w->co 时 ，21og LR( 了 ZI,，…， 也 ,) 有 极 
限 分 布 Xe 
定理 的 确切 陈述 和 证 明 可 参看 陈 希 骄 < 数理 统计 引 论 >p.326 
~330. 还 有 一 点 需要 明确 : 原 假设 @z 中 可 以 包含 不 止 一 个 点 .这 
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时 , 定理 3.5 的 含义 是 ; 不 论 参数 真 值 6 落 在 Ba 内 何 处 ,2Jog 上 LR 
的 极限 分 布 总 是 自由 度 为 的 分布 伦 . 

利用 这 个 定理 可 近似 决定 (8.631 中 的 OCO 和 x. 为 此 ， 把 
210ogLR( 玉 1,，…-， 昼 ,) 的 分 布 看 成 是 确切 地 等 于 “2 则 应 取 


0O~oxp[ 训 x?(0) |,7—0. (3.67) 
当 0 和 7y 按 (3.67) 式 到 时 , 由 (3.63) 确 定 的 检验 p 满足 
lim Bs(9) 一 0 对 任何 9€ Br. (3.68) 


常 把 满足 这 条 件 的 检验 p 称 为 有 渐 近 水 平 w. 

我 们 就 例 3,12 和 3.18 来 验证 一 下 这 定理 的 正确 性 ,在 例 
3.12 中 ，2 log LR(，…, 卫 ,) 一 n( 玉 -00)?” 当 原 假 设 09=0。 
成 立时 ，~Mn( 卫 一 00)~ 入 (0, 1)， 故 依 定义 有 mn( 下 一 00)?~x4. 
在 这 个 场合 ，2 log LR 的 精确 分 布 就 是 其 极限 分 布 。 本 例 t= 
1—0=1. 

例 3.18 较 复杂 . 记 庙 = 一 nps, 由 (3.66) 有 

log La- 六 "log 2 一 加 (oa 二 Ad) log(1+ -2 -) 
| (3.69) 
在 原 假设 成 立时 ， 按 大 数 定律 ， 有 vi/n—>pi 当 %->00, 即 ay 一 >0 
( 依 概率 或 以 概率 1)， 于 是 按 (3.69), 有 


log LR~D (np p04) [名 -3( Ks ) +0( 和 点) 


人 ND, 
注意 到 习 1 一 0, 由 上 式 得 
210g 7B 一 六 mi/ rpi+O( 宫 邮 /o)， (3.70) 


我 们 来 证 明 : 1/n? 一 > 0, 车 wn->oo 且 原 假设 成 立 ， 事 实 上 , 依 中 
心 极限 定理 , 有 ju/ VnB-B) -一 > WN(0, 办 .由 此 知 Ww? /ns/3 
” 当 w>co 时 有 极限 分 布 。 因为 内/ 太一 地 (h/t 而 0， 
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知 码 /oa 一 二 > 0( 在 证 明定 理 3.6 时 ， 已 用 过 这 个 事实 )， 于 是 由 
(8.70) 知 ， 在 原 假设 成 立 而 w->co 时 , 21og 了 刀 与 阅 2/mps， 即 


(3.9) 式 的 %， 有 同一 极限 分 布 ， 故 由 定理 3.1， 推 出 在 本 例 中 ， 
21og LR( 节 ) 的 极限 分 布 是 改 -1， 而 "一 1 正 是 8 的 维 数 与 @z 的 
维 数 之 差 。 也 可 以 反 过 来 看 ; 从 定理 3.5 出 发 ,把 定理 3.1 作为 其 
利用 当 样 本 大 小 w~>co 时 , 统计 量 的 极限 分 布 所 构造 的 检验 ， 
称 为 大 样本 检验 .由 于 不 知道 统计 量 的 精确 分 布 是 常 有 的 事 , 这 
类 大 样本 检验 在 应 用 上 有 重要 的 意义 . 

例如 ， 有 两 个 总 体 , 其 均值 分 别 为 和 和 0s。 要 检验 假设 耳 : 
91 一 0ot 民 :91 尖 0s， 在 这 两 个 总 体 中 分 别 抽出 独立 随机 样本 于 + 


和 了 Ym 记 立 -二 党 己 了 -二 第 了 。 设 机 
个 总 体 的 方差 o 和 cz 都 非 0 有 限 , 则 根据 中 心 极限 定理 , 当 原 假 
设 成 立即 0 一 9 时 , (总 一 了 )/w of/mi-Fo3/mns 的 分 布 当 nt->o0 
和 wo->co 时 收敛 于 标准 正 态 分 布 (0, 1)。 又 


如 ~ 忆 ( 了 - 束 )W (ma 一 贡 和 己 =S(Y 了) (m1) 


分 别 是 o3 和 cg3 的 相合 估计 。 故 车 令 
丰 一 (总 一 了 )/NW Sn Sa/ns, (3.71) 


则 当 原 候 设 成 立 且 m1->oo，ns->co 时 ,J 的 分 布 也 收 化 于 入 (0， 
1)， 因 此 ,以 | 到] 全 as 为 否定 域 的 检验 ， 当 mi 一 >co，ms->co 时 渐 
近 地 有 水 平 a (确切 意义 如 (3.68) 式 ). 

似 然 比 检验 的 一 项 最 重要 的 应 用 ， 是 处 理 涉及 正 态 分 布 参数 
的 假设 检验 问题 ， 这 个 内 容 我 们 将 在 下 节 中 集中 论述 ， 在 那里 我 
们 将 指出 , 就 对 正 态 分 布 参数 的 应 用 而 言 , 似 然 比 检验 具有 良好 的 
人 性质， 一般 地 说 , 用 似 然 比方 法 作出 的 检验 , 在 绝 大 多 数 情况 下 表 
现 是 不 错 的 , 但 也 有 例外 情况 , 见习 题 15. 
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§ 3.6 正 态 分 布 参数 的 检验 及 有 关 检 验 


(一 ) 引言 

在 一 般 请 况 下 , 有 理由 假定 , 试验 的 随机 误差 近似 地 服从 正 态 
分 布 ， 因 此 , 在 涉及 这 种 随机 误差 的 大 量 应 用 问题 中 , 不 少 可 以 归 
结 为 正 态 分 布 参数 的 检验 , 特别 是 正 态 分 布 均值 的 检验 , 这 就 是 著 
名 的 一 样本 和 两 样本 t 检验 ， 它 们 都 是 似 然 比 检验 . 

然而 , 在 有 些 情况 下 , 有 足够 的 理由 怀疑 , 随机 误差 的 分 布 可 
能 与 正 态 分 布 有 较 大 的 偏离 。 这 时 , 检验 问题 的 提 法 就 需要 作 相 
应 的 修改 , 而 导致 不 同 的 检验 方法 。 由 于 这 种 问题 在 应 用 上 很 重 
要 , 我 们 也 在 这 一 节 中 附带 地 讨论 一 下 。 系统 地 处 理 这 种 问题 属 
于 非 参 数 统计 这 个 专门 分 支 的 范围 ， 


(二 ) 一 样本 检验 

设 有 样本 i,，…， Xe co， 和 ac 都 是 未 知 参 数 ， 考 
虑 梯 验 问题 

Hi:ia=a0OFK :+0, (3.72) 

ao 是 给 定 的 已 知 数 ， 

在 实际 应 用 中 , 这 个 问题 最 常 在 以 下 两 种 情况 下 发 生 ， 

1. ao 是 一 个 标准 值 ， 例 如 ， 某 种 化 工 产品 中 所 含 某 物 质 的 
量 。 由 于 大 批 生产 中 随机 性 因素 的 于 扰 ， 以 及 可 能 存在 的 系统 性 
因素 的 干扰 , 产品 中 所 含 该 物质 的 量 不 会 总 等 于 wo。 随机 抽取 该 
产品 % 份 作 分 析 ， 定 出 其 中 该 物质 含量 分 别 为 蕊 1，…， 互 。。 车 
假定 随机 误差 有 于 态 分 布 入 (0, o3)， 则 可 认为 定 1，…*, 了 芝 ,~ 依 
(g, o?)， 如 果 4 一 ao, 则 系统 性 因素 不 存在 , 产品 中 所 含 该 物质 的 
量 与 we 的 偏差 可 全 归结 于 随机 因素 .车 azao， 则 表示 有 某 种 系 
统 性 原因 存在 , 使 产品 所 含 该 物质 的 平均 量 与 标准 值 oo 不同， 这 
时 就 有 必要 找 出 原因 , 以 消除 这 种 系统 性 因素 . 

2. 两 处 理 的 对 比试 验 .。 在 数理 统计 学 中 , “处 理 ” 一 词 的 含义 
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极 广 ， 它 可 以 表示 一 种 工艺 流程 ,一 个 种 子 品种 ,一 种 治疗 方法 等 
等 。 现 有 两 种 处 理 , 为 确定 计 设 想 为 两 种 施肥 方法 , 要 设计 一 种 试 
验 , 以 判明 其 效应 是 否 有 差别 . 

选择 ”对 试验 单元 , 每 对 中 的 两 个 试验 单元 条 件 尽 可 能 均匀 ， 
而 不 同 对 中 的 单元 则 可 有 较 大 差别 。 在 每 一 对 单元 中 , 随机 地 决 
定 其 中 之 一 施加 处 理 甲 , 另 一 施加 处 理 乙 , 正 如 在 例 3.3 中 所 做 的 
那样 ， 而 记录 其 指标 值 ( 如 单位 面积 产量 )、 以 2; 记 第 纪 对 单元 
中 , 甲 的 指标 值 与 Z 的 指标 值 之 差 ， Xi,…，X， 就 是 我 们 的 样本 . 
车 假定 试验 的 随机 误差 服从 正 态 分 布 ， 则 有 互 1，…， 互 ww Na， 
0o3).“ 围 、 乙 两 处 理 的 效应 无 差别 ”相当 于 4 一 0。 于 是 我 们 得 到 
问题 (3.72) 当 go=0 的 情形 . 

现 考虑 (3.72) 的 水 平 o 似 然 比 检验 .样本 CXi,，…， 蔗 ;) 的 似 
然 函 数 为 


fr “rs Tn G) 一 人 《 30 ) "exp( -如 = 总 Cm @)*). | 
(3.78) 


考虑 到 
eu 2 (00) D5)’, (38.74) 
Max og "oe /" =(n/24)"e "3 (A4>0) (38.75) 
易 算 出 似 然 比 为 


ZR(e oo) ~ [SS Coo) /Sm 
=-[i+a( lz /VSD ]. 
由 此 知 似 然 比 检 验 有 否定 域 和 | 及 aol / 识 (X 一 对 ”>0]. 为 
确定 常数 0, 考虑 统计 量 
T=- VR /YT HEF). (3.70) 


由 定理 1.1 及 分 布 的 定义 , 知 当 4=ao 时 了 ~ 如 -1， 即 月 由 度 为 
% -于 的 上 上 分布。 给 定 wE(0, 1),， 可 从 t 分 布 表 上 ， 查 出 满足 
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P (1>> 如 -:( 生 )) 的 值 刀 -: (各 )， 由 于 t 分布 密 度 关于 0 对 称 ， 


此 值 也 满足 (|_| > -:( 
a 
当 | 了 | > 如 -:( 多 ) 时 否定 及, 不 然 就 接受 及 。 《3.77) 


由 (8.76) 定 义 的 统计 量 了 称 为 一 样本 z 统 计量 ,而 检验 
《3.77) 则 称 为 一 样本 + 验 检 ， 统 计量 了 在 4 一 ao 成 立时 的 密度 函 
数 一 一 即 在 (I.31) 式 中 改 n% 为 % 一 1, 是 英国 统计 学 家 W. SB. Gos- 
set 首 先 发 现 的 ， 他 在 1908 年 用 ‘Btudqent” 的 笔名 , 在 Biometrika 
杂志 上 发 表 了 这 个 结果 . 因此 , 上 分 布 也 常 称 为 Student 分 布 . 
这 个 结果 的 发 现在 数理 统计 学 的 发 展 史 上 是 一 件 大 事 ， 因 为 它 开 
了 小 样本 理论 发 展 的 先 声 。 在 这 以 前 , (83.76) 的 统计 量 了 的 分 布 
是 近似 地 作为 正 态 分 布 来 处 理 ， 在 此 应 提 到 的 是 : Gosset 本 人 并 
未 得 出 也 的 分 布 的 严格 证 明 ， 他 是 在 “了 的 分 布 属于 Pearson 分 
布 族 ” 这 个 假定 之 下 ,得 出 的 密度 的 . 严格 的 证 明 是 及 . A。 
Fisher 在 儿 年 后 作出 的 。Fisher 与 Gosset 有 长 期 的 通信 关系 .在 
这 些 通信 中 ，Fisher 发 展 了 用 % 维 几何 (把 样本 看 作 "中 的 一 个 
点 ) 处 理 抽样 分 布 的 方法 , 并 形成 了 重要 的 “自由 度 概念 . 

有 时 , 实际 问题 归结 为 检验 问题 是 “ 单 边 形式. 

H:a<aOFK :> wo. (3.78) 
如 在 上 述 化 工 产 品 的 例 中 , 入 (ga, o”) 是 产品 所 含 某 种 杂质 的 量 的 
分 布 , ea<ao 表示 杂质 平均 含量 不 超过 某 个 允许 值 ao。 在 两 个 处 
理 比 较 的 对 比试 验 中 ,w<0 表示 处 理 甲 不 优 于 乙 。 
注意 到 当 2z>ao 时 ,有 


min n> (ma 一 Dm) 。 
易 得 (3.78) 的 似 然 比 为 


(B= 于 是 得 到 (3.72) 的 水 平 a 


各 , 4 加 AmV3 
LR(%, 0 wn ) -| /¥ (wi — 2) ] ; TC Ao; 


4, zu, 
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与 例 3.12 的 后 一 部 分 相似 , 并 利用 刚才 得 出 的 结果 ， 易 知 当 0<a 
<1/2 时 , (3.78) 的 水 平 wx 似 然 比 检验 为 
当 了 >> 刀 _i(@) 时 否定 互 ,不 然 就 接受 且 . (3.79) 

(3.79) 也 称 为 一 样本 检验 ， 有 时 分 别称 (8.77) 为 双边 或 双 侧 
的 ， 而 (3.79) 为 单 边 或 单 侧 的 。 这 和 名词 可 从 两 个 意义 去 理解 ， 
(3.72) 的 对 立 假设 KK 居于 原 假设 五 的 两 边 ， 而 (3.78) 则 居于 一 
边 . 或 者 , 检验 (3.77) 的 否定 域 两 端 都 有 , 而 (3.79) 则 只 有 一 端 . 

车 w>1/2, 则 似 然 比 检 验 是 类 似 于 (3.65) 那 样 的 随机 检验 , 
此 时 我 们 不 用 似 然 比 检验 而 仍 用 检验 (3.79). 

可 以 证 明 ， 检 验 (3.77) 和 (3.79) 分 别 是 (3.72) 和 (3.78) 的 水 
平 a 的 UMPU 检验 ， 当 w>1/2 时 ，(3.79) 是 (3.78) 的 UMP 检 
验 ， 


(三 ) 对 比试 验 中 的 其 他 检验 法 

回 到 上 一 段 中 甲 、 乙 两 处 理 在 ”对 试验 单元 中 的 比较 问题 . 当 
试验 误差 服从 正 态 分 布 时 , 相应 的 检验 问题 是 (3.72) 或 (3.78)( 其 
中 ao 一 0)， 用 一 样本 检验 去 处 理 . 若 没有 把 握 认 为 试验 误差 为 
正 态 , 则 必须 用 另外 的 方法 去 检验 .下 面 介 绍 几 个 重要 的 方法 . 

1. 符号 检验 在 有 的 情况 下 ， 同 一 对 试验 单元 中 甲 、 乙 两 处 
理 的 比较 ,不 能 用 一 个 数量 指标 去 表述 ， 例 如 ,让 同一 个 人 品尝 
种 酒 , 他 的 评价 可 能 是 “ 甲 比 乙 好 ”, 或 “ 乙 比 甲 好 ” 或 “难于 区 别 ” 
以 致 不 予 回答 ”每 对 单元 中 的 试验 结果 给 出 一 个 符号 . 

十 ; 甲 比 乙 好 ; 一 ; 乙 比 甲 好 ; 0.; 难 区 别 ,无 结果 . 

根据 各 种 符号 的 多 少 来 检验 “ 甲 、 乙 一 样 "这 个 假设 . 

设 ww 对 单元 的 试验 中 ,“ 十 ”号 出 现 w; 次 “一 ”号 出 现 mn 次 ， 
其 余 为 “0”， 如果 甲 、 忆 一样, 则 在 ww 一 wy 十 n_ 个 非 0 结果 中 , 每 
个 有 辣 等 的 机 会 是 十 或 一 ， 故 在 这 个 情况 下 , m+ 的 分 布 为 二 项 分 


布 B(x 二) 车 甲 、 乙 两 处 理 确 有 优 劣 之 分 , 则 每 个 结果 取 “+” 
号 的 概率 大 可 . 故 车 记 肝 =n;, 则 所 提问 题 转化 为 检验 问题 ; 了 
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~B(w,p), 0<p<1, 于 0 去 e 到 :py 可， 一 个 合适 的 检验 
为 ; 
当 | 开 一 w/3|>O 时 ,否定 < 甲 、 乙 一 样 ”, 不然 就 接受 ， 
(3.80) 
0 之 值 要 根据 给 定 的 水 平 a， 用 二 项 分 布 表 去 决定 。 为 使 “是 丰 
实 水 平 , 必要 时 须 用 随机 检验 ( 即 令 p( 交 ) 一 7 当 | 一 w/3j 一 0)， 
车 w 很 大 , 则 可 用 大 样本 检验 利用 当 p 一 1/2 而 w->co 时 ,2 下 
一 /2)/ Vw 的 分 布 收 合 于 术 (0, 1), 可 得 出 (3.80) 中 0 的 近似 
信 为 VTua/s/2，us 由 (3.54) 确 定 . 
有 时 ， 检 验 的 目的 是 从 “ 甲 不 优 于 乙 ” 和 “ 甲 优 于 乙 ” 中 选择 其 
一 .以 前 者 为 原 假设 , 则 问题 成 为 , ~B(w, p), 0<p<1, Hp 


<1/2 0 大:p> 计 这 种 问题 在 例 3.1 中 就 出 现 过 ， 并 在 例 3.9 


中 证 明 它 有 UMP 检验 , 其 否定 域 为 {了 >>0} 这 种 形式 . 

这 里 讨论 的 检验 通称 符号 检验 ， 因 为 它 是 基于 试验 结果 的 符 
号 ， 从 统计 模型 而 言 , 它 不 过 是 二 项 分 布 参数 检验 的 一 个 特例 ， 

2. Fisher 的 置 质 检 验 这 种 检验 的 思想 和 实施 方法 已 在 例 
3.3 中 仔细 描述 过 了 . 由 于 (3.5) 中 那 35 个 值 是 按 (3.4) 的 方式 把 
符号 作 一 切 可 能 的 置换 而 得 到 , 故 称 为 置换 检验 。 在 此 我 们 作 几 
点 补充 说 明 ， 

一 是 例 3.3 所 描述 的 模型 ， 与 导致 假设 (3.72) 时 所 据 的 假定 
有 些 不 同 。 这 里 所 指 的 还 不 是 随机 误差 是 否 服从 正 态 分 布 一 点 ， 
而 在 于 , 在 导致 (3.72) 的 论述 中 , 我 们 认为 同一 对 试验 单元 的 差别 
可 忽略 不 计 , 而 随机 误差 纯 系 由 试验 中 其 他 种 种 不 可 控 因 素 而 来 . 
在 例 3.8 中 则 相反 ， 误 差 的 来 由 正 是 因为 同一 对 内 的 试验 单元 的 
条 件 有 所 差别 , 而 其 他 种 种 不 可 控 因 案 导 改 的 误差 则 可 忽略 不 计 ， 
虽然 如 此 ,不 难看 出 ,在 例 3.3 中 的 论证 , 即使 在 这 里 仍然 有 效 . 因 
为 , 如 甲 、 乙 两 处 理 无 差别 , 而 同一 对 内 试验 单元 的 分 配 又 是 等 可 
能 的 , 则 甲 、 乙 处 在 完全 对 称 的 地 位 ， 比 方 说 , 在 一 次 试验 中 发 更 
也 =1.5， 则 根据 上 述 对 称 性 ， 也 有 同等 的 可 能 也 == 一 1.5， 因 


4 


此 , 例 3.3 那里 的 讨论 仍 可 用 于 此 处 ， 即 使 在 更 一 般 的 场合 , 其 中 
流 有 不 可 控 的 随机 因素 起 作用 而 同一 对 内 的 试验 单元 也 有 所 老 
别 , 例 3.3 记 描 述 的 置换 检验 程序 同样 可 用 . 

另 一 点 是 在 例 3.8 中 我 们 曾 指 出 ， 实 施 该 例 中 所 描述 的 检验 
法 ,其 困难 在 于 计算 量 太 大 。Fisher 自己 及 其 他 许多 学 者 ， 都 研 
完 过 这 样 的 问题 . 当 m 很 大 时 , 可 否 找到 一 种 近似 的 程序 去 实施 葡 
换 检 验 , 以 大 大 前 化 计算 ?研究 结果 证 明了 ; 在 很 一 般 的 条 件 下 , 这 
_ 种 简化 程序 不 仅 存在 , 且 就 是 通常 的 了 检验 ! 这 是 .一 个 很 有 意思 的 
结果 .， 因 为, 一 开始 , t 检验 是 在 一 个 很 有 局 限 性 的 模型 ( 正 态 ) 中 
子 出 的 。 通过 这 个 途径 ,发现 即使 在 远 为 广泛 的 模型 下 , 只 要 试验 
次 数 足 够 大 , t 检验 仍 是 合用 的 .因此 可 以 说 , 置换 检验 的 理论 从 
一 个 侧 曾 加 强 了 t 检验 的 地 位 .无庸 效 言 , 在 % 不 大 时 ,置换 检验 
与 地 检验 有 显著 的 差别 . 


《四 ) 两 样本 答 验 
设 样本 i, :Xmn~N(g, 0), 了， Y ,~ NCD, o), Fh 
全 体 样 本 独立 ， 这 里 a.5 和 都 是 未 知 参 数 ， 注 意 方 差 o? 相同 ， 
考虑 检验 问题 
Hio~b OFK:ozrb., (3.81) 
通常 把 六 (wm, o3) 和 (5, 0”) 看 作 是 两 个 总 体 的 分 布 , 而 革 样 本 
和 了 样本 分 别 来 自 这 两 个 总 体 , 故 (3.81) 常 称 为 两 样本 问题 ， 这 
种 问题 最 常见 的 情况 是 两 处 理 的 比较 , 但 不 是 成 对 比较 ， 选 择 mm 
十 % 个 条 件 比较 均匀 的 试验 单元 ， 随 机 地 从 其 中 抽取 m 个 施加 
处 理 甲 , 其 结果 记 为 了 ,…, 子 mw, 和 璋 下 的 施加 处 理 乙 , 其 结果 记 为 
了 ji,…, 了 ,。 若 假定 对 每 个 处 理 而 言 ， 随 机 误差 都 服从 均值 为 0 
的 正 态 分 布 且 有 等 方差 , 又 设 各 试验 单元 的 随机 误差 相互 独立 , 则 
甲乙 两 处 理 是 否 有 差别 的 判定 ,就 归结 为 检验 问题 (3.81). 
现 导 出 (3.81) 的 似 然 比 检验 ， 记 2z= (oa，…，zm)，9V 一 
(0 …， gw。 合 样本 (Zi，…， 室 mn， 了:，…， 了 。) 的 似 然 函 数 
为 
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oj gg， Do) 一 (W27g)-G+m 
xexp| — 5 (SG.-a + wD)|. 
(3 .82) 


利用 (3.74) 和 (3.75) 式 , 易 得 
sup{f lz%, yy, &, b, 0); 一 c<<0i 0 到 ce， o>0} 
~—sup{( Ry pe ) n+mDeXp (- 5 81): o>0 | 
el [2 we/ (m+n)] (m+n)/9 SST/2 
其 中 六 = 加 (we 一 四 ?十 (ww 一 仿 % 同样 ,有 
sup{ f(z, y, &, b, 0);: ~ <o=b<o0, o>0} 
~sup{( 25c ) -mV exp( 一 2 So) o>0| 
一 [2re/ (m+n)] TS m+n)/2 
此 处 一 六 (wm 一 2 十 避 (yy 一 2) 而 s 一 (many)/(m 十 m)， 因 
此 似 然 比 为 


LR(z, y)=— (S/S1) "2. 
注意 到 m2 一 ?nCg 一 2)? 一 mm(z 一 9)2/(m+%w)， 以 及 Ss 一 Bs 
十 m(2 一 2)? 十 n(y 一 2 易 见 似 然 比 是 
T*—|z—y|/VS1 
的 严 增 函 数 。 由 此 知 (3.81) 的 似 然 比 检验 有 和 否定 域 {|2 [>O]， 
为 确定 0, 我 们 来 证 明 : 当 原 假设 o 一 成 立时 ,有 


Ts mt) (CY)/ YENtne as (3.83) 
事实 上 ,2 可 写 为 

Tm Ye]/Y mes") 

(3.84) 

由 于 两 组 样本 独立 , 又 由 定理 1.1, 里 与 涩 (一 术 独立， 也 与 
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立 (7, 一刀) 独立 , 故 闷 , 了, 六 CE 一人)” 法 (Y,- 了 )? 四 变量 相 
互 独立 ,由 此 推出 -与 81 独立 . 又 /一 ( 宙 -Ma 


~N(0, 1) ( 当 a=b 时 )， CK) /or ~ BP) 


一 1)~x2-1 且 二 者 独立 ， 故 5B/o?~ 双 4m-s( 定 理 1.1 及 系 1,1). 
于 是 由 (3.84) 及 1 分 布 的 定义 即 得 (83.83). 
由 (3.83), 得 (3.81) 的 水 平 a 的 似 然 比 检验 有 和 否定 域 
2 > 加 4a-a(a/2). (3.85) 
可 以 证 明 : 它 是 UMPU 检验 ，(3.83) 所 定义 的 统计 量 Ti; 常 称 为 
两 样本 了 统计 量 ， 基于 它 的 检验 ， 例 如 (3.85)， 称 为 两 样本 检 
验 . 
车 检验 问题 是 五 :4-6=c :4 一 6 关 c(c 给 定 )， 则 只 须 在 
7 的 定义 中 ,把 分 子 的 且 一 了 改 为 苹 一 了 一 6, 其 他 无 变化 . 
对 检验 问题 
H:a—-b<00OFK:o—b>0 (3.86) 
来 说 , 易 算 出 当 9>Z 时 ,有 
sup{f (w, ya，D，o): 一 co<a b, <o0, o>0} 
一 SU0p{ F(z,， y, a, b, o; ~oo<a<b<o0, o>0} 
一 [2re/ Cm+n)] -3ST +/ 


这 时 有 LR(%, y) 一 1， 车 5<z， 则 首先 注意 , sup{ 六 (2 一 0)?+ 
六 (yp 一 0)?:a< 可 必 在 o=8 时 达到 ,事实 上 , 任 取 a<5. 车 5< 
元 则 
Pm) + Hy 0) > Do) + Py -5 
车 5> 则 当 @<5 时 , 改 a.b 都 等 于 妈 当 5<6<z 时 改 5 为 6, 都 
可 以 使 上 述 平方 和 增 大 ， 由 此 得 出 上 述 结论 , 从 而 知 当 5<5 时 
sup{f(%, y, o, D，o): 一 ceo<a 和 0<co， o>0} 
=sup{f(x, y, &, b, o):—oo0<a=b<o0, o>0} 
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= 一 [2xe/ (m+ n)] mt/ayF tna 
总 结 上 述 得 
1, 当 Yy > 7; 


3.87 
(S/S mV MIB, 8) 


LR(z, y) -| 


与 例 3.12 与 (3.75) 相 似 , 由 此 得 出 ; 若 给 定 水 平 a< 雪 , 则 (3.86) 


的 似 然 比 检 验 有 否定 域 
TI > tren af(aw)， (3. 88) 


车 a> 溺 ， 则 似 然 比 检验 将 是 随机 化 的 ， 因 此 在 这 个 情况 下 我 们 


不 拘泥 于 似 然 比 检验 , 而 仍 取 以 (3.88) 为 否定 域 的 检验 ， 可 以 证 
明 : 这 个 检验 是 UMPU 检验 . 

检验 问题 五: a 一 5 之 0 中 玉 :4 一 5<0 不 是 新 间 题 ,因为 可 交 
换 wb 的 位 置 。 又 车 原 假设 为 a 一 5<cle 给 定 ), 则 只 须 用 一 Y 
一 c 代替 (3.82) 右 边 分 子 中 的 定 一 了 ,其 余 一 切 无 变化 . 

前 面 我 们 假定 了 两 总 体 的 方差 相同 。 车 方差 不 同 且 未 知 , 则 
得 到 下 面 的 问题 : Xi …， Xn~N(g, o3), Pi, ……, Ya~N(D, 
02)， 全 部 样本 间 立 ，w%、5、 o?、 o3 都 未 知 ， 要 检验 假设 (3.81) 或 
(3.86)， 这 个 问题 世 称 Behrens-Fisher 问题 ， 是 Behrens 在 
1929 年 首先 提出 , misher 等 在 三 十 年 代 一 系列 文章 中 讨论 过 ， 这 
个 假设 检验 问题 引起 了 很 多 著名 学 者 的 兴趣 , 有 关 的 文献 很 多 , 提 
出 了 种 种 检验 方法 ， 小 样本 大 样本 的 都 有 .我 们 将 在 84.2 中 结 
合 讨论 Fisher 的 信任 推断 法 , 去 讨论 Fisher 提出 的 一 种 检验 法 ， 


(五 ) 两 样本 问题 其 他 检验 法 

当 随 机 误差 不 服从 正 态 分 布 时 ， 两 处 理 的 比较 问题 就 需要 更 
广 的 提 法 , 并 使 用 相应 的 检验 方法 ， 这 方面 的 理论 和 方法 很 多 , 但 
大 都 很 专门 ， 这 里 只 能 很 简略 地 讨论 一 下 

1. 置换 检验 法 这 个 方法 的 思想 及 具体 作法 与 例 3.3 相似 . 
把 两 处 理 的 全 部 试验 结果 ， 即 ，…， 卫 m, 了 1,…，, 了 。 改 记 为 
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Zi1, 机 Dmin. 如 果 了 两 处 理 力 、 乙 无 差别 ， 则 Zi ***, Vmin 之 闻 的 
差别 不 是 由 于 处 理 的 不 同 而 来 ， 而 契 由 于 这 mw 十 % 个 试验 单元 的 
分 配方 法 而 来 . 在 吧 十 ”个 试验 单元 中 分 配 mx 个 给 处 理 甲 ,不 同 


的 方法 有 | "各 若 在 每 种 分 配方 法 之 下 都 计算 以 下 的 量 : 


yg 一 工 ( 息 处 理 试验 信之 和 ) ~- 工 ( 乙 处 理 试验 值 之 和 )、 
它 等 于 Z1;…, Znmin 中 的 加 个 的 平均 减 去 剩 下 的 m 个 的 平均 . 那 mm 
个 则 要 看 试验 单元 是 如 何 分 配 的 , 这 样 ,一 共 能 得 到 wn-(™") 
个 值 . 

91, go ,Yn, | | 之 19s 之 … 之 1gx|. (3.89) 
这 与 (3.5) 那 35 个 值 的 作用 相似 ， 在 “ 甲 、 乙 两 处 理 效果 一 样 ” 的 
原 假设 成 立时 , (3.89) 中 那 不 个 值 中 的 每 一 个 ， 有 同等 出 现 的 机 
会 /N。 就 实际 样本 算出 g 之 信 ， 即 g* 一 逐一 了 ， 如 果 原 假设 不 
成 立 ，| 六 | 倾向 于 取 较 大 之 值 。 因 此 , 给 定 水平 a 后, 用 下 面 的 方 
法 检验 . z 

当 |g*| 之 gew.1| 时 否定 原 假 设 , 不 然 就 接受 . (3.90) 
如 果 原 假设 是 “处 理 甲 不 优 于 乙 ”, 对 立 假设 是 “处 理 甲 优 于 乙 ”, 则 
只 有 在 y*( 而 不 是 |g*|) 大 时 才 导 致 否 定 原 假设 . 这 时 , (3.89) 中 那 
NV 个 值 要 排列 为 加 之 hap 之 … 之 hy, 只 有 在 9*>>hcxay 时 才 否 定 原 候 
设 ， 这 个 检验 的 “置换 ”特点 更 明显 ， 它 是 基于 mw 十 n 个 原始 试验 
佳作 一 切 可 能 的 置换 而 产生 的 ， 在 一 样本 情况 下 对 置换 检验 所 作 
的 两 点 说 明 , 仍 完全 适用 于 此 处 ， 特 别 , 当 m.n 都 很 大 时 , 上述 登 
换 检 验 接近 于 两 样本 i 检验 ， 有 如 在 一 样本 的 情况 , 这 个 性 质 从 
一 个 侧面 加 强 了 两 样本 t 检验 的 地 位 . 

2. Wilooxon 秩 和 检验 我们 再 看 看 假设 (3.81)., 若 记 9 一 b 
-6， 而 (sw) 为 第 一 总 体 的 分 布 (a, o?)， 则 第 二 总 体 的 分 布 
N (5, o”) 可 宸 为 (sz 一 办、 如 果 我 们 免除 掉 太 (%) 为 正 态 分 布 本 
数 这 一 假定 , 而 把 它 当 作 完 全 未 知 的 ， 则 得 到 这 样 一 个 问题 ; 及 1， 
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一 0 要 检验 假设 
万 .0=0t 玉 , 090(F 完全 未 知 )， (3.91) 


这 是 一 个 典型 的 非 参数 检验 问题 ， 因 为 样本 (Xi,…， 全 m1， 
…, 了) 的 分 布 族 为 {FP(w1)…F 了 (wm)F(y 一 0)…F(y, 一 0): 大任 
意 }， 这 个 分 布 族 不 能 用 有 限 个 实 参 数 去 刻 划 . 如果 把 1，…， 
和 了 1，…， 了 分别 看 作 是 甲乙 两 个 处 理 的 试验 值 , 则 (3.91) 
就 是 两 处 理 效 果 无 差别 的 检验 问题 ， 但 此 处 对 随机 误差 的 分 布 已 
不 再 假定 为 正 态 的 . 
暂 设 了， 了 1， 了 这 mm 十 ww 个 值 两 两 不 同 .把 它 
们 按 大 小 排列 , 结果 为 
Zi<Ls LL, N=m-t+n, (3.92) 


每 个 了 , 必 是 序列 (3.92) 中 的 某 一 个 ”车 了 ,一 Zag,， 则 称 了 ,在 合 
样本 入 1 ”3 .op Y,, “3 了 了 。 中 的 秩 为 BR. 记 
z WR (3.93) 


它 称 为 W ilcoxon 的 两 样本 秩 和 统计 量 ， 是 Wilcoxon 在 1945 
年 一 项 工作 中 引进 的 . | : 
现在 这 样 推理 : 每 个 RE, 都 可 取 1，2, …, 六 为 值 , 这 六 个 数 


的 平均 为 襄 (1+2+… 十 衣 ) 一 卫 二 上， 车 0 一 0， 则 全 部 样本 来 


自 同一 分 布 , 每 个 都 不 占 特殊 地 位 。 故 要 所 取 之 值 应 在 其 平均 值 


六 二 附近 ， 反 之 ,车 9>0, 则 了 样本 倾向 于 比 卫 样 本 大 , 而 


已 倾向 于 取 二 2，…, 妈 中 较 大 一 端的 值 ， 因 此 , WW 取 值 将 倾向 
于 比 wCNT+1)/2 大 ， 反 之 ,车 6<0, 则 列 倾向 于 取 比 nCN+1)/ 
2 为 小 的 值 ， 总 之 , 当 9 了 0 时, | 玉 一 nCN 十 1)/2| 倾 向 于 取 大 值 , 
这 种 分 析 导 致 如 下 的 检验 法 : 

当 | 友 一 n(N 十 1)/3| 之 O 时 否定 96~0, 不然 就 接受 . (83.94) 
O 的 确定 在 原则 上 可 以 解决 : 当 原 假设 /一 0 成 立时 , 合 样 本 独立 
同 分 布 。 由 此 根据 对 称 性 的 考虑 , 易 知 (Ra ，…， 忌 ) 的 分 布 为 
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PORi=71, ***, R,=7,) 
CNCN 一 12.(N 一 nn 十) 当 训 ,7 为 彼此 不 同 
的 ,不 超过 六 的 自然 数 ; 
0, 其 他 . 


(3.95) 
由 此 就 不 难 形 式 地 写 出 柬 的 分 布 , 从 而 根据 给 定 的 水 平 “去 确定 
(3.94) 中 的 C0( 必 要 时 随机 化 ,或 略 修改 a 之 值 )。 对 较 小 的 m,n 
这 是 可 行 的 且 已 造 了 表 . 但 当 m%.n 较 大 时 计算 很 复杂 , 因此 得 依 
人 靠 极限 定理 . 可 以 证 明 : 在 原 假 设 0= 0 成 立 之 下 , 当 mm 都 一 cc 
时 , 统计 量 


(W—nCN+1)/2) / /二 mn(N+1) (3.96) 


的 分 布 收敛 于 慰 准 正 态 分 布 入 (0, 1)。 由 些 , 当 m、% 都 较 大 时 ， 
对 给 定 的 水 平 % 可 以 按 公式 


Oo aa 十 mn(N+1), (3.97) 


近似 决定 (3.94) 中 的 CO. 

如 果 假 设 是 单 边 的 , 即 . 

及 :6<0CEK:0 交 0( 玉 任意 )， (3.98) 
则 将 双边 检验 (3.94) 修 改 为 单 边 的 , 即 ， 

， 当 到 一 n(N+1)/2>>0 时 否定 五, 不然 就 接受 . (3.99) 
给 定 a 后, 0 的 值 也 可 通过 玉 的 分 布 ( 在 互 成 立时 ) 定 出 ， 在 
mn 较 大 时 , 则 利用 统计 量 (3.96) 的 极限 分 布 。， 它 给 出 (3.99) 中 
0 的 近似 值 

Oxwoy 二 mn N+1). (3.100) 


检验 (3.94) 和 (3.99) 都 称 为 Wileoxon 的 两 样本 秩 和 检验 ， 
它 是 Wilooxon 在 1945 年 提出 的 一 种 重要 的 秩 检验 ， 一 般 , 秩 检 
验 是 指 这 样 一 类 检验 , 在 其 中 只 利用 样本 的 秩 ， 秩 检验 是 最 重要 

的 一 类 非 参 数 检验 , 有 汶 刻 的 理论 和 广泛 的 应 用 ， 
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不 一 看 可 能 会 觉得 , 这 种 秩 检验 效率 不 会 高 , 因为 它 只 利用 了 
样本 中 的 大 小 关系 而 完全 忽略 了 其 具体 数值 ， 其 实 不 然 . 近代 关 
于 秩 检验 欧 大 样本 理论 证 明了 ， 一 般 秩 检验 至 少 在 样本 大 小 较 大 
对， 与 传统 的 参数 检验 并 不 逊色 、 拿 Wilcoxon 检验 与 两 样本 # 
检验 的 比较 来 说 , 即使 当 随机 误差 分 布 了 确 为 正 态 时 ;Wilcoxon 
检验 的 效率 相对 于 上 检验 也 达到 3/w 之 0.95( 样 本 大 小 较 大 时 ). 
对 别 的 了 ,这 个 相对 效率 可 任意 大 , 且 总 不 会 低 于 0.864. 

以 上 我 们 假定 了 合 样本 有 耶 ,…， 玉 ，。，， 了 i,，…, 了 Y，, 彼此 不 同 ， 
因而 了 ,的 秩 有 B; 可 唯一 定 出 。 若 假定 五 处 处 连续 , 这 一 事实 将 以 
概率 工 成 立 ， 这 时 不 存在 问题 。 当 了 不 连续 时 , 合 样 本 中 可 能 出 
现 相 同 的 , 即 所 谓 “ 结 ”的 问题 。 这 是 秩 理论 中 一 个 很 细致 的 问题 ， 
在 此 不 仔细 讨论 了 . 

最 后 我 们 指出 : 在 文献 中 Wileoxon 检验 也 常 被 称 为 Mann- 
Whitney 检验 ， 或 Wileoxon-Mann-Whitney 检验 ， 因为 后 两 
位 作者 在 1947 年 提出 了 另 一 个 统计 量 ， 它 与 WV 比 只 相差 一 个 党 
数 , 二 者 所 导出 的 检验 当然 完全 相 辣 ， 


(六 ) 正 态 分 布 方差 的 检验 
1. 一 样本 情况 设 及 ,…', 有 ~ 和 Nlw, ac wa 和 oa 都 是 未 
知人 参数 . 先 考虑 检验 问题 
五 : ac3 一 0 《>》 开 .oa 天 ar 《3 .101) 
这 里 co>0 为 给 定 的 已 知 值 . 
下 面 先 定 出 (3.101) 的 水 平 a 的 似 然 比 检验 ， 似 然 函 数 为 
(3.78)。 利 用 (83.74) 和 (3.75), 不 难 算 出 似 然 比 为 


TB ,on) = (e€) "0 € i osD) 
: (8.102) 
注意 到 函数 g(o) 一 zw2e-%2 在 o>0 处 先 降 后 升 ， 且 由 定理 1.1 
知 ， 当 o3 一 03 成 立时 , 志 的 分 布 为 自由 这 wm-1 的 避 分 布 ， 即 
性 -z, 不 难得 到 (3.101) 的 水 平 a 的 似 然 比 被 验 为 
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当 js<eE< 加 时 接受 原 假设 ,不 然 就 否定 。 《3.103) 
其 中 五 ,kz 为 下 述 方程 组 的 解 ， 
br/ 30-h/2 — Es/ 368—kY2, 
P(x2_1<h)+ P(x21> ka) =a. 
这 个 侯 然 比 欠 验 不 是 UMPU 的 检验 , 但 与 之 相去 不 远 。 可 以 证 
明 ， 车 把 (3.104) 的 第 一 方程 中 的 呈 改 为 nm- 一 工 而 解 出 如 .ps， 则 
《3.103) 将 是 UMPU 检验 . 
方程 (3.104) 的 解 不 易 得 到 。 一 般 就 取 


bi = Xx?- :(1 - 包 ) 大 一 邓 :( 和 号 ) (3.105) 


而 采 记 检验 (3.108)， 这 样 得 到 的 检验 仍 有 水 平 &, 与 UMPU 检 
验 相 去 不 远 。 而 如 .Xa 可 由 分布 玫 上 查 得 , 

单 边 假设 o? <oi 已 在 (3.55) 那 里 提 到 过 ， 在 该 处 指出 了 其 
UMP 检验 . 

2. 两 样本 情况 设 玉 1 …*， Xmn~~N(g, 0， 了， 
N(5, o3), a、56、o3 和 cs 都 是 未 知 参 数 ， 又 合 样本 芷 1，…*， 太 m， 
上 1 …， 了 ,相互 独立 。 考 虑 检验 问题 

Hol<oai oO 开 :a>a2. (3.106) 
二 一 个 假设 检验 问题 ci O02?<o2 可 通过 更 换 互 , 了 的 地 位 
45 玫 为 (3.106)。， 另外, 还 有 双边 检验 问题 
H:o}~o2¢» K:o?+¥o2. (3.107) 
(3.106) 的 似 然 比 检验 容易 推 得 , 此 处 只 写 出 其 结果 : 记 
P-Lt SK T/T YY). (3.108) 
在 原 假设 成 立时 , 了 服从 自由 度 为 mw 一 和 % 一 1 的 五 分 布 ， 即 
Fn n-1. 定义 Fn_1,n-1C0), 使 

PEFn yn 1> Pantn-i(0)) =a, (3.109) 
mi,n-i(0) 的 值 可 在 了 了 分布 灾 上 查 到 .(3.106) 的 水 平 o 的 似 然 
比 检验 为 , 


(8.104) 
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当 环 > 太 in_i(o) 时 否定 原 假 设 ,不 然 就 接受 (3.110) 
(与 以 前 几 个 情况 相似 ， 当 a 三 1/2 时 ，(3.1t0) 确 为 似 然 比 检验 ， 
而 当 w>1/2 时 则 略 加 调整 ) 可 以 证 明 ， 它 是 (3.106) 的 水 平 a 的 
UMPU 检验 . . 
(3.107) 的 似 然 比 检验 要 复杂 些 ， 利 用 (3.74) 和 (3.75) 易 算 
出 其 似 然 比 为 


mm/2 
LR(w1, *, wm, Yi yn O01+P")" (+ ) . 


(3.111) 
此 处 了 一 -他 二 + ,而 了 由 (3.108) 给 出 ,0 为 一 个 只 与 m,n 有 


%—1 
关 的 常数 ,不 难 验 证 (证 明 留 给 读者 ): (3.111) 右 边 作为 FP 的 画 
数 ， 在 0 二 F"<<co 内 先 降 后 升 。 由 此 得 出 (3.> 六 ) 的 水 平 a 的 似 
然 比 检验 为 : 

当 太 << 了 < fs 时 接受 原 假 设 ,不 然 就 否定 。 (3.112) 
其 中 方 和 fs 是 下 述 方程 组 的 解 . 


m—1 )( n—l1 1 \m? 
(HT + 天 


mm—1 m2 n—l1 1 \™? 
-+ 了 户 ) (+ 了 二 FE/) 3 
P(Fn_in-i<fi) -+ PF ni>f2)=a. 


(3.118) 
这 似 然 比 检验 不 是 UMPU 检验 , 但 与 之 相去 不 远 ， 可 以 证 明 :; 若 
把 (3.118) 第 一 方程 中 的 指数 m/2 和 nw/2 分 别 改 为 (m 一 14)/2 和 
(一 二 /3 而 解 出 二 和 fs, 则 (3.112) 将 是 UMPU 检验 . 
方程 (3.118) 不 易 解 . 一 般 就 取 


fi=F ma 一 $), fa=F mn) (8.114) 


而 采用 检验 (3.112)， 这 可 由 五 分 布 表 上 查 出 。 这 样 定 出 的 检验 
有 水 平 w 且 接 近 UMPU 检验 . 
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$3.7 序 贯 概率 比 检验 


(一 ) 序 贯 检验 

到 目前 为 止 ,我 们 在 对 一 个 假设 进行 检验 时 , 所 用 样本 的 样本 
大 小 是 一 个 固定 的 常数 , 与 样本 本 身 的 取 值 无 关 . 凡是 基于 这 种 
洋 本 的 检验 方法 ， 就 称 为 固定 样本 检验 . 这 个 园 定 的 样本 大 小 
的 选 定 , 可 以 是 基于 某 种 考虑 . 比方 说 , 为 了 使 检验 有 足够 的 功效 ， 
n 至 少 需要 多 大 ， 也 有 可 能 ， 样 本 就 是 一 批 现 成 的 资料 ， 这 时 
是 一 个 “既成 事实 ”而 并 非 出 自 有 意 的 安排 .但 这 些 都 无 关 宏 旨 . 
如 在 例 3.1 中 ,为 要 确定 一 批 产 品 是 否 该 接受 , 先决 定 一 个 wn, 然 
后 从 这 批 产品 中 抽出 % 个 , 以 进行 检验 . 

与 此 对 立 的 一 种 做 法 是 ， 我 们 不 是 一 劳 永 逸 地 决定 一 个 样本 
大 小 n, 而 是 在 抽样 的 过 程 中 去 决定 它 ， 确 切 地 说 , 我 们 先 定 下 第 
一 批 抽样 多 少 个 , 例如 nm 个 ， 抽 祥 得 到 样本 及 …， 子 。, 后 , 我 们 
根据 这 些 样本 的 具体 值 去 决定 ， 或 者 是 抽样 到 些 为 止 而 作出 一 个 
决定 (接受 或 否定 原 假设 ), 或 者 我 们 认为 ,由 已 得 的 样本 总 ，…， 
已 , 尚 难于 作出 这 种 决定 , 而 需要 再 抽 一 些 样 , 抽 的 个 数 mm 也 取决 
于 天, …, 了 了,, 的 值 ， 一 般 地 , 在 每 一 阶段 的 抽样 完成 后 , 我 们 都 
面临 上 述 抉择 , 或 者 停止 抽样 , 或 继续 抽 , 抽 多 少 也 由 到 当时 为 止 
已 有 的 样本 去 决定 . 凡是 按 这 样 的 方式 去 进行 抽样 以 作 检 验 的 ,就 
叫做 序 贯 检验 。 形式 上 , 固定 样本 检验 可 视 为 序 贯 检验 的 一 个 特 
例 ， 
使 用 序 贯 检验 的 原因 , 一般 不 外 乎 以 下 两 种 : 

1. 在 有 的 情况 下 , 不 论 你 事先 指定 的 样本 大 小 多 大 , 所 抽 得 
的 样本 使 我 们 感到 难于 作出 决定 。 如 检验 正 态 分 布 六 (9, 1) 中 关 
于 9 的 假设 9<0， 如 果 由 样本 算出 的 肝 就 等 于 0， 或 [于 | 极 小 ， 
我 们 会 觉得 , 不 论说 9<0 或 g>0 都 嫌 证 据 不 足 ， 若 勉强 下 一 结 
论 就 很 可 能 出 错 ， 又 如 在 例 3.1 中 , 若 样本 中 所 含 废品 数 很 多 或 
很 少 , 我 们 感到 较 有 把 握 作出 决定 。 反 之 , 若 废品 数 不 多 不 少 , 则 
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感到 下 结论 把 握 不 大 .这 时 可 能 有 必要 再 抽出 些 产 品 作 检 验 . 

2. 另 一 个 原因 是 为 节省 试验 次 数 , 因而 节省 费用 .一 般 地 这 
可 以 理解 为 : 为 了 使 所 作 的 统计 推断 达到 一 定 的 性 质 ( 例 如 , 为 使 
一 个 水 平 wx 的 检验 的 功效 至 少 等 于 B)， 使 用 序 贯 抽样 平均 说 来 ， 
可 能 比 使 用 固定 样本 的 抽样 次 数 少 ， 一 个 简单 但 不 其 典型 的 例子 
如 下 ; 设 在 例 3.1 中 , 买卖 双方 决定 抽 20 件 产 品 , 若 其 中 废品 数 不 
超过 2 就 接收 该 批 产品 , 否则 就 拒 收 。 按 固定 样本 帮 法 须 抽 20 件 
产品 去 检验 .但 我 们 也 可 以 一 个 一 个 地 抽 , 直到 抽出 3 个 废品 ,或 
抽 满 20 件 为 止 。 这 时 , 在 某 些 情况 下 抽样 的 次 数 就 可 以 小 于 20. 

这 种 序 贯 抽样 方法 显然 不 止 适用 于 假设 检验 ， 对 参数 估计 和 
其 他 统计 推断 问题 也 适用 . 其 实 , 这 种 作法 在 种 种 领域 以 至 日 常 
生活 中 也 很 常见 ， 例 如 ,在 掌握 情报 不 够 时 , 推迟 对 一 件 事情 采取 
行动 ， 以 待 有 更 充分 的 情报 时 再 说 。 序 贯 方法 的 主要 缺点 也 正在 
于 其 “ 序 贯 "性 . 它 使 应 用 者 在 事先 对 “到 底 要 试验 到 何 时 心里 没 
有 底 , 而 产生 心理 上 的 压力 ， 另 外 , 在 有 些 情况 下 , 分 阶段 抽样 在 
组 织 和 实施 上 也 带 来 不 少 麻烦 。 以 此 之 故 , 总 的 说 来 ,在 目前 序 贯 
方法 的 应 用 还 不 多 . 

序 贯 检验 最 早 的 一 个 重要 例子 是 产品 验收 中 的 所 谓 复式 抽样 
方案 .一 批 产品 的 废品 率 pw 未知。 买卖 双方 经 过 协商 定 下 4 个 
数 : a、B、 pa、 pe, 0<<o, 8B<1， 0<<pa 达 pe 二 1。 要 制定 一 种 抽样 验 
收 方案 ， 使 ; 1 . 当 废 品 率 p<%ps 时 ， 这 批 产品 被 拒 收 的 概率 不 超 
过 xc。2， 当 废 品 率 Pp 之 ps 时 ， 这 批 产品 被 接受 的 概率 不 超过 6. 
Dugue 和 Romig 设计 的 复式 抽样 方案 如 下 : 确定 五 个 数 m, rg， 
c1 0a，5C。 先 抽 m 个 产品 去 检验 。 若 其 中 的 废品 个 数 于 所 0c1, 则 
接受 该 批 产品 ,车 卫 之 cs 则 拒 收 ， 车 0 过 也 过 co, 则 再 抽 mm 个 产 
品 去 检验 . 以 互 记 所 抽出 的 轩 士 ma 个 产品 中 的 废品 数 ， 若 壮 拟 
c, 则 接受 该 批 产品 , 否则 就 拒 收 .满足 上 述 1.2. 两 个 条 件 的 固定 
( 单 式 ) 抽 样 方案 ( 即 , 定 下 两 个 数 mw ce， 抽 ww 个 产品 ， 视 其 中 废品 
数 是 否 <c 而 决定 是 否 接受 该 批 产 品 ) 也 可 以 找到 , 但 所 需 抽 样 次 
数 一 般 比 复式 方案 多 。 
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上 面 介绍 的 复式 抽样 方案 是 一 种 两 阶段 抽样 ， 且 第 二 阶段 的 
抽样 次 数 na 也 定 了 (一 般 的 两 阶段 抽样 ， 第 二 阶段 抽样 次 数 与 第 
一 阶段 所 得 样本 有 关 )。 一 般 ， 对 任何 自然 数 m， 可 有 了 阶段 抽 
样 ， 每 阶段 抽样 个 数 可 以 多 于 1， 且 可 与 以 前 阶段 所 得 样本 值 有 
关 ， 著 对 m 不 加 限制 , 就 是 所 谓 纯 序 贯 抽样 ， 这 时 , 不 论 指定 的 mm 
多 大 ,有 可 人 能 ( 视 所 得 样本 而 定 ) 在 经 过 mw 阶段 的 抽样 后 , 还 须 继续 
再 抽 ， 这 种 纯 序 贯 抽样 的 一 个 重要 例子 是 著名 统计 学 家 A. Wald 
在 二 次 大 战 期 间 发 展 起 来 的 , 叫 序 贯 概率 比 检 验 . Wald 是 为 适 
应 战 时 大 量 验收 军需 品 的 要 求 而 提出 他 的 方法 的 . 战 后 1947 年 ， 
他 发 表 了 egSequential Analysis» 这 本 著作 , 介绍 了 他 的 方法 . 

前 已 提 到 ， 序 贯 方法 目前 应 用 尚 不 多 .在 这 不 多 的 应 用 中 ， 
Waild 的 序 贯 概率 比 检验 占有 突出 的 地 位 , 以 此 之 故 , 我 们 在 下 面 
几 段 中 简要 地 介绍 一 下 这 种 检验 , 但 不 过 多 地 深入 其 细节 . 


(二 ) 序 员 概 率 比 检验 的 定义 
设 总 体 分 布 有 概率 函数 fw, 9)， 参 数 9 只 有 两 个 可 能 伸 ; 9 

和 0。 要 检验 假设 
H:0-0 .0 ERE:0=0,. (8.115) 
车 给 定 了 样本 大 小 n, 且 抽样 得 到 独立 随机 样本 nm …， ww。 则 根 
据 NP 基本 引 理 ，(3.115) 的 UMP 检验 有 否定 域 {JT[J (mw，6s)/ 


fc 01)]>>0}, 0 取决 于 给 定 的 水 平 a〈 暂 不 考虑 随机 检验 ). 

把 O 这 个 值 作 为 决定 是 否 接 受 瑟 的 截然 界线 ， 使 人 觉得 太 
绝对 化 。 为 了 克服 这 一 点 ，Wald 引进 了 一 种 序 贯 检验 . 下 面 给 
出 其 形式 定义 . 

定义 3.8 在 上 述 记号 下 , 确定 一 种 序 贯 检验 程序 如 下 : 指定 
常数 4， 了 4<< 也， 样本 mi za，… 一 个 一 个 地 抽 ( 每 次 一 个 ). 车 在 
得 到 wz …，w-i 后 抽样 尚 不 能 停止 ， 则 再 抽 mw。 然后 计算 思 一 


站 [fms gf(aw。 60], 且 当 z<4 时 接受 原 假设 互 , 当 2> 五 时 
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否定 吾 . 若 4<,<<B, 则 继续 抽样 得 wa. 算出 及 41 再 按 以 上 规则 
处 理 . 这 个 检验 称 为 序 贯 概率 比 检 验 , 简称 SPRT( 是 Sequential 
Probability Ratio Test 的 缩写 ) 。 

定义 中 的 常数 4.B, 要 由 一 定 的 条 件 去 确定 , 见 ( 三 ). SPRT 
的 直观 意义 很 清楚 ， 只 有 当 概 率 比 的 值 比较 显著 地 偏 于 一 边 时 
才 作 决定 ,不 然 就 继续 手 样 , 直到 这 种 情况 出 现时 为 止 . 

引进 记号 

Zlog[f (em, 0s)/f (1, 01)], Bs— Zs. (3.116) 


则 SPRT 可 表 为 ， 当 8,<log 4 时 接受 及 ， 当 5 之 log B 时 否定 
3 如 ,而 当 | 
log A<S,<logB 

(3.117) 
时 继续 观察 wi。 如 在 (m， Ss ») 的 
直角 坐标 系 中 作 两 条 与 m” 轴 平行 的 
直线 如 图 所 示 ， 把 平面 (nw 之 0 的 部 
分 ) 割 成 三 部 分 .在 此 坐标 系 中 标 
出 点 Cn，8S) 如 图 . 则 只 要 点 继续 落 在 中 间 的 带 形 域内 , 就 要 继续 
抽样 , 什么 时 候 从 上 端 (下 端 ) 越 出 这 个 区 域 , 就 否定 (接受 ) 原 假设 
如 


logA 


举 两 个 简单 例子 . 
例 3.14 设 总 体 分 布 为 两 点 分 布 
P,(X¥=1)=p, P(XF=0)~1—~y. (3.1]8) 
这 相当 于 从 一 批 有 废品 率 的 产品 中 作 有 放 回 (车 批 中 产品 数 很 
大 ， 也 可 以 是 无 放 回 的 ) 的 抽样 ， 并 规定 抽 得 凑 品 时 了 =14， 否 则 
为 0. 设 0< 四 二 各 二 1 要求 检验 问题 
五 :0 一 信人 天 :np—p (3.119) 


的 SPRT, 此 处 有 fC 人 =-p)+%， 族 Z1=Xlog 名 +(1 


~ 辽 ,)log 二 一 各 ee 人 pe 因此 著 记 


ed156， 


工 一 (1—%1) 
4,=(4-nlog 了 -名 下 全)/ no -Pa 圭一 Pd 
可 “ET 8 1p) pi(i—pa) ” 


1 一 一 和 / ef( 工 一 Pall —p1) 
B, = -nlog = 二 全 ) log pT ps) 


则 SPRT 为 , 当 oe 2 HD TB 时 否定 且 ， 当 


4,< 六 ,二 B 时 继续 抽样 
例 3.15 总 体 分 布 为 畏 (9，1)， 这 时 
了 (7， -7 e032 


有 到 一 夫 ( 民 一 扑 ) "一半 (一 05)? 一 (Gs 一 的 ) 下 一 要 (组 一 下) 


注意 到 如 91 知 检验 问题 (3.115) 的 SPRT 与 便 3.14 的 spRT 
有 相同 形式 ,但 4, 和 B, 分 别 改 为， 


4 一 (A4+ 委 (级 -0D)/(0s-0)， 
B,—( B+ (000)/(0, 6). Pd 120) 


因为 SPRT 是 从 修改 由 NP 站 本 引 理 所 快活 和 六 驴 入 
因此 有 理由 期 望 , 这 个 检验 具有 某 种 优良 性 ， 这 一 点 欧 甘 
了 令 述 这 个 结果 , 我 们 用 六 米 表 示 当 采用 SPRT 册 计 读 
次 数 ， 注意 六 不 是 一 4 固定 常数 而 是 一 个 随机 攀 屿 多 因为 , 抽样 
何 时 终止 ,要 取决 于 抽 得 的 样本 ,而 样本 是 随机 上 多 当 参 数 6 取 值 
4: 或 ga 时 ,平均 抽样 次 数 为 妃 o (TY ) 和 Be 冰 个 )” 除 此 以 外 ,还 要 
考虑 两 类 错误 的 概率 ， 以 SPRT(4, B) 包 问题 (3.115) 的 、 由 定 
义 3.8 所 确定 的 序 贯 概率 比 检验 , 它 犯 第 一 、 二 类 错误 的 概率 , 分 
别 记 为 和， 设 0<a<1, 0<B<1， 有 下 面 的 定理 

定理 3.6 设 9 是 问题 (3.115) 的 任 一 个 检验 ( 序 贯 的 或 非 序 
贯 的 )， 其 抽样 次 数 记 为 W*， 而 其 犯 第 一 、 二 类 错误 的 概率 分 
史记 为 of，B*， 如 果 a*<a，B*<B， 则 必 有 页,(N”)>> 权 (CN)， 
Eo(N')> Bo N). 
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这 个 定理 的 意思 是 : 在 一 切 其 犯 两 类 错误 的 概率 分 别 不 超过 a 
和 的 检验 类 中 , 以 SPRT 的 平均 抽样 次 数 最 少 ， 这 个 定理 首先 
由 Wald 猜测 其 成 立 ， 并 由 他 和 Wolfowitz 予以 证 明 。 证 明细 市 
不 能 在 此 给 出 了 . 


(三 ) 边界 值 4, 五 的 确定 
问题 是 这 样 . 给 了 a.B, 0<a, B<I。 要 决定 4、B 之 值 , 使 
z SPRT(4, 8B) 犯 一 .二 类 错误 的 概率 分 别 等 于 a 和 6. 
\ 这 问题 的 确切 解答 只 对 个 别 分 布 族 作出 来 了 ， 且 形式 也 很 夏 
入、 杂 . Wald 在 其 前 引 著作 中 ， 提 出 了 一 个 决定 4、B 的 近似 公式 ， 
”下 面 来 推导 这 个 公式 、 为 确定 计 , 设 f(z, 9) 是 概率 密度 : 记 


AN T= {(%w1, “3 :4<TI[JGes ga) /fw 01)] <B, 


mi 于 [Ke 63)/f(m, 9D)1>B}. 


秋 
Ne 


a [fC 65)/F(m, 02)1 <B, 


， a gm 一 人 (H fl, poe do, (8.121) 
因为 在 TP, 上 有 让 f(m, 90) < 于 站 fF(ww 9 ,有 
c< 于 习 | (站 Hoo 05) )dmsewden (1~p)/B. 


n=] 


(3.122) 
下 面 的 直观 想法 给 和信 这样 的 项 (3.122) 中 的 改 号 两 边 的 量 差 别 


不 大 . 这 是 因为 , 由 Cfo, 03)/f (ms, 90)] 到 I [Co O05)/ 


foo 91)], 多 了 一 个 因子 .根据 T, 的 定义 ， 前 一 乘积 还 小 于 了 
.158 。 


而 后 一 莱 积 就 大 于 B 小 ,因此 它 不 大 会 比 BB 大 很 多 。 类 似 地 有 
圭一 上 一 bp | 企 fw,, 1) )aai…dz 


>3 | (fw oaoram-B/4. 


| (3.123) 
由 (3.122), (3.123), 得 出 
B/(i—-oa)<A4<B<(1-B)/a. (3.124) 
此 式 给 出 了 4 的 下 界 和 B 的 上 界 . 根据 前 面 所 提 的 直观 理由 , 可 
以 希望 (8.122) 和 (3.128)“ 大 致 上 ”是 等 式 。 由 此 得 出 4、B 的 近 
似 值 . 
AB/(1i—«), BS(1— 8B)/o. (3.125) 
暂 记 41=B/(1 一 a), Bi 一 (1B)/a, 把 SPRT(41, Bi) 作为 近 
似 解 。 我 们 要 间 ; 这 个 近似 解 , 即 SPRT(4:，B:), 犯 一 、 二 两 类 错 
误 的 概率 or 和 Bi 与 原来 给 定 的 值 和 8 比较 如 何 . 按 (8.124) 
《注意 (3.124) 不 含 近 似 成 分 ), 应 有 
Bi/(1—o)<Ai=B/(1l—o, (1—Bi)/m> B= (1—B)/a. 
(3.126) 
由 (3.126) 不 难 推 得 
ou<a/(1—B), BI<B/(L~0), oa 二 Bi<a+AB. 

(3.127) 
因为 a, B 一 般 接 近 于 0, (3.127) 的 前 两 式 表 明 ， 采 用 近似 检验 
SPRT(4;, B1), 其 犯 两 类 错误 概率 mm 和 B1, 即使 比 预定 值 wx， 
有 所 增加 ,但 增加 量 也 很 小 . (3.127) 最 后 一 式 并 指出 : 两 类 错误 概 
率 之 和 只 能 下 降 而 不 会 增加 ， 因 此 ,使 用 近似 值 (3.125) 可 能 的 重 
要 后 果 是 ， 由 于 使 错误 概率 不 必要 地 过 于 缩小 而 增 大 平均 抽样 次 
数 。 例如, 在 问题 (3.119) 中 车 取 p1=0.05, pa 一 0.17, a=0.05, 
8 一 0.10, 则 由 近似 公式 (1.125) 所 确定 的 SPRT(41:，B1), 其 犯 两 
类 错误 的 概率 分 别 为 a 一 0.081 和 Bi=0.099， 后 一 值 与 预定 值 
0.10 很 接近 ,但 o 与 w 一 0.05 相 去 则 较 远 。 
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(四 ) 复合 假设 的 情况 

在 实际 应 用 中 , 像 (3.115) 那 样 ， 原 假设 和 对 立 假设 都 只 包 念 
一 点 的 异 况 不 多 见 , 一 般 是 参数 8 可 以 在 一 个 区 间 里 取 值 .在 这 
种 情况 下 , SPRT 如 何 用 ?本 段 来 讨论 一 下 这 个 问题 . 

设 总 体 分 布 有 概率 函数 x, 9), 8 在 一 区 间 内 取 值 , 而 bo 是 
其 一 内 点 .考虑 检验 问题 

H:0<0. OK :0>00. (3.128) 
通常 ， 当 参数 值 9 落 在 ge 附近 ( 离 be 很 近 ) 时 ， 不 论 是 接受 还 是 
否定 卫 ， 从 实际 角度 看 都 没有 多 大 差别 ， 上 比方 说 如 一 0.。 当 0= 
一 10-” 时 ， 否定 五 也 不 一 定 很 错 ; 当 0 一 10- 如 时 ,接受 互 也 不 一 
定 很 错 .。 在 这 种 情况 下 往往 可 以 指定 两 个 数 0 9, 0 天 加 < 下， 
使 当 b 适 由 时 ， 和 否定 五 是 严重 错误 当 0> 加 时 ,接受 忌 是 严重 
错误 .至 于 当 册 <0< 如 时， 无 论 是 接受 或 否定 瑟 ， 情 况 都 没有 
什么 重大 影响 。 这 样 一 来 , 原来 的 检验 问题 (3.128) 可 以 用 更 切实 
际 的 检验 问题 
H:0<0. 0 EK:0>0, (3.129) 
去 代替 之 。 

再 进一步 看 : 在 0 委 和 的 范围 内 ， 唯 有 b5 这 个 点 与 对 立 假 设 
0>b。 最 接近 .因此 它 在 某 种 程度 上 可 取 作 原 假设 的 代表 。 关 似 
地 ,ga 可 取 作 对 立 假 设 的 代表 。 这样 ,我 们 可 以 从 考虑 简单 的 假设 
检验 问题 (8.115) 入 手 ,去 处 理 (1.129) 的 问题 。 更 确切 地 说 , 我们 
对 (3.115) 找 出 一 个 较 好 的 检验 ， 期 望 它 即 使 作为 (8.129) 的 检验 
仍 是 较 好 的 ， 有 既然 按 定理 3.6, SPRT 是 (3.115) 的 一 个 优良 检 
验 , 那么 , 有 理由 期 望 , 它 也 是 (3.129) 的 一 个 优良 检验 ， 这 就 实现 
了 把 SPRT 用 于 复合 假设 检验 的 想法 . 

例如 , 对 产品 验收 的 例 3.14， 若 买卖 双方 商定 的 废品 率 界 限 
为 0.05， 则 理应 检验 p<<0.05 伞 2>0.05， 但 双方 可 能 认为 ， 在 
0.045<2p<0.055 的 范围 内 ， 怎 么 处 理 都 不 算 大 错 ， 于 是 可 以 用 
2p 一 0.045 p=0.055 来 代替 原先 的 检验 问题 。 
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但 在 这 桩 做 时 ,有 一 个 重要 问题 要 解决 ， 设 用 问题 (8.115) 代 
替 (3.129) 而 使 用 SPRT(4, B), 且 4, B 的 选择 要 使 SPRT(4,， 
万) 作为 (3.115) 的 检验 时 ， 其 犯 两 类 错误 的 概 玉 分 别 不 超过 a 和 和 
B, 则 当 把 SPRT(A，,B) 作 为 (8.129) 的 检验 时 ， 这 个 性 质 能 否 维 
持 ? 更 确切 地 说 , 若 以 8(9) 作 为 SPRT(4，B) 的 功效 函数 , 即 
8G)- 衬 | fl 9)) dmiewdan, (3.180) 
则 是 否 能 成 立 
B(O) Sa 000, BO)>1-BYYO>0. (3.131) 
注意 , 按 4, B 的 取 法 , 我 们 有 
B(O) =&, BlOs) =—1-— BB. (3.132) 
由 (3.182) 可 知 ,如 果 B(9) 为 9 的 非 降 函 数 , 则 (3.131 必 成 立 . 因 
此 , 关于 是 否 能 用 (3.115) 的 SPRT 去 检验 (3.129) 的 问题 ， 就 归 
结 为 “< 由 (3.180) 定 义 的 B80) 是 否 为 9 的 非 降 函 数 > 这 个 问题 ， 可 
以 证 明 ， 对 一 类 很 重要 的 分 布 , 这 一 点 成 立 ， 特 别 是 , 其 中 包括 了 
指数 型 分 布 族 f(z, 9) 一 0(90)ex7Eh(z), Q(0) 为 9 的 严格 单调 
丽 数 ， 这 包含 了 例 3.14.3.15 及 另 一 些 在 应 用 上 重要 的 例子 . 


习 题 

1. 把 例 3.3 中 的 检验 的 否定 域 仔 细 描 述 出 来 . 

2， 设 下 1 ;了 ,~ R(0, 09), 0>0， 指 定 60>0. (38) 证 明 0<60 喇 9> 
9 的 UMP 检验 存在 ， 并 算出 水 平 wx 的 TMP 检验 的 功效 国 数 . (b) 指定 
Be (a, 4)、 证 明 : 不 论 n 多 大 ， 不 存在 上 述 检验 问题 的 水 平 4 检验 , 使 其 功 
效 函数 在 对 立 假设 上 处 处 大 于 6、 (6) 证 明 : 06=8% +> 9 站 96 的 UMP 检验 不 
存在 (提示 : 取 负 > 名和 角 <% 分 别 考虑 检验 问题 9=-0o 9=6)， 

3. 设 和 1 …， 入 ww (9 20), 6>0， 指定 加 >0.。 问 : 9<0oc> b> 
的 UMP 检验 是 否 存在 ?( 提 示 : 取 舱 >90。 考 虑 检验 问题 9 一 66 439 一 抽 ， 证 
明 所 得 的 水 平 4 的 UMP 检验 也 是 9<6oe0=4 的 UMP 检验 . 再 考察 此 
检验 是 否 与 外 有 关 ， | 

4， 设 万 为 已 知 自然 数 。 为 检验 一 事件 的 概率 2 是 否 和 Do， 将 试验 独立 
地 重复 下 去 ， 直 到 该 事件 发 生 姑 次 为 止 。 久 开 记 到 那 时 为 止 的 试验 次 数 ， 
(8) 证 明 和 的 分 布 为 


a AT » 


和 7—1 _ 
Po X= (1 PCP), sh k+l ee, 


《证明 p 生 po Op>>p 的 UMP 检验 存在 . 

5. 设 六 …,， 和 mn 为 抽 自 一 总 体 的 独立 随机 样本 , 总 体 密度 为 (1.8) , 指 
定 1>0. 证 明 < 和 A>h 的 UMP 检验 存 在 ,并 利用 六 分 布 表 出 它 . 

6. ( 续 上 题 ) 若 上 题 中 X1,…，Xs 表示 受 试 的 所 个 元 件 的 寿命 , 而 我 们 
实际 上 只 试验 到 有 * 个 失效 时 即 停止 . 这 * 个 的 寿命 从 小 到 大 记 为 Zi …” 
了 ,。 作 出 9<B0 20>g 的 基于 了， …， 了 vr 的 UMP 检验 . 

7， 设 有， Xm。~ NCa, ,了 …, 了 mn~ 和 Nb, 了 站 , 合 样本 ;六 mn 
了 1,…, 了 s 独 谤 ,9.2 都 未知， 证明 : 5<a 5>4 的 UMP 检验 存在 , 且 有 
否定 域 了 了 一文 >0. (提示 ; 取 定 41<bi， 令 4= 《ma 十 m01)/(m 十 %)， 考 虚 
检验 问题 4 二 8 一 .Aera 二 14, 0 一 人 0H.) 

8. 设 VCGz) 为 一 检验 函数 , 而 了 = 了 工 ( 科 ) 为 充分 统计 量 . 证 明 : EoCg(X)| 
人 也 是 检验 函数 ， 且 其 功效 函数 与 9 同 。 这 个 结果 说 明了 什么 问题 ?( 提 示 : 
由 充分 性 知 Be(ep(X)i17) 与 6 无关， 再 由 9 为 检验 函数 证 明 BoCp(X) 17) 
也 是 ,》 

9. 设 了 …， 及 a~. 入 (0, 也. 考虑 检验 问题 9=0 3 9 村 0. 证明: 当 且 
仅 当 4= 一 clc>>0), 以 {0 对 <o} 为 接受 域 的 检验 才 是 无 偏 的 . 

10. 考虑 第 ?7 题 。 试 作出 4=b > xxb 的 一 个 无 偏 检验 . 

堪 . 试 在 原 假设 成 立 的 情况 下 , 以 及 在 对 立 假设 的 情况 下 , 计算 Pearson 
所 统计 量 (3. 邹 的 均值 . 

12. 在 生产 同一 种 产品 的 甲 、 乙 两 厂 中 各 抽出 *% 个 产品 组 成 % 对, 让 ”n 
个 人 每 人 评判 一 对 各 人 的 评判 是 " 甲 好 `、 乙 好 `“ 甲 乙 一 样 "这 三 种 之 一 ， 
试 根 据 ”个 评判 结果 , 用 娄 检验 法 检验 “ 甲 、 乙 两 厂 产 品质 量 无 差别 ”这 个 假 

13. 验证 (3.64) 和 (3.65) 式 . 

14. 为 了 检验 一 事件 的 概率 pp 是否 <1/2(p<1/32 p>1/2)， 用 两 种 
方法 检验 。 一 种 是 用 第 生 题 的 作法 , 定 %=0.05. 重复 试验 至 该 事件 第 3 次 
不 发 生 为 止 , 设 到 这 时 为 止 的 试验 次 数 为 13， 一 种 是 事先 预定 做 12 次 试验 ， 
结果 发 现 该 事件 发 生 9 次 ， 在 水 平 c=0.05 之 下 , 分 别 用 这 两 种 情况 下 的 试 
验 结果 去 检验 p<j/3e> 2>1/3( 都 用 UMP 检验 )， 二 者 结果 不 同 ， 本 例 说 
明了 什么 问题 ?5 样本 不 止 看 它 的 数据 , 还 要 看 它 怎么 来 的 。) 

15. 有 -个 二 维 总 体 (X,， 了 ), 其 分 布 为 : 


当 9=(4 1 …- 了 ) 时 (6 为 加 维 ); 
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P(X=Y=i)=P,(X=Y7=—i)=1/3m, i=1, 7 
P(X=Y=0)=1/3. 


当 9= (94 …, 9%) (9:>0, 沪 0,=D 时 : 


Po(X=Y=1i)=0,/m, Peo(X=Y~= 一 站 一 0， 一 十， *"*, 1, 
PelX=Y=0)=(m—1)/m. 


参数 空间 为 6= (1,，…, 了 U {01,…, 9m) :0.>0, 为 9= 壬 . 抽 大 小 为 1 的 


随机 样本 ， 作 真实 水 平 为 1/3 的 似 然 比 检验 , 证 明 其 否定 域 为 {G 分 ， ?一 了 
…， m}， 其 功效 函数 在 对 立 假设 上 之 值 为 1/m。 若 ws>3， 则 这 个 似 然 比 检 
验 还 不 如 根本 不 作 试 验 就 取 检验 函数 9 三 1/3、 试 在 m>3 时 , 找 出 一 个 真 
实 水 平 为 1/3 的 合理 检验 (此 例 是 也 , L. Lehmann 举 出 的 ). 

16. 证 明 : 一 样本 检验 (3.79)( 单 边 )， 确 是 相应 假设 的 水 平 < 检 
验 . 对 两 样本 检验 证 明 同 一 结果 . 

17. 在 正 态 两 样本 情况 下 ， 给 定 e>0 找 出 of=co3 ea oooj 的 似 然 
比 检验 (提示 : 通过 变换 把 。 化 为 1). 

18. 计算 8 3.7( 一 ) 中 的 复式 抽样 方案 (ara，cb oo 0) 的 功效 函数 ， 

19. 设 总 体 分 布 为 ERC(0, 9), 要 检验 假设 9<160>>1， 定 序 贯 抽样 方案 ， 
如 下 : 定 自然 数 m， 依 次 观察 1，XX2,，…, 若 对 某 个 i 及 ,>1 且 i<m， 则 
停止 抽样 而 否定 9<1。 不然 就 观察 到 及 为 站， 然后 视 nax (ZX …， 芭 mn) 
>c 或 否 以 决定 是 否定 或 接受 9<1. 试 计算 此 检验 的 功效 函数 及 平 均 抽样 
次 数 (注意 它们 都 是 9 的 函数 ). 

20. 设 总 体 分 布 为 NC9, 1)， 取 名 < 抽 ， 以 8 记 90=9o > 9=01 的 序 贯 
概率 比 检验 ， 证 明 : 9 的 功效 函数 是 6 的 非 降 函 数 ( 提 示 : 任 取 <0"， 考 虑 
两 个 独立 同 分 布 的 序列 和 立 ?… 一 人 (9 1), i， X50" 1)， 就 
这 两 个 序列 分 别 算出 (3.116) 式 中 的 8， 分 别 记 为 3 和 Se. 注意 : 若 记 
六 二 Xs 十 (0” 一 9)， 则 由 序列 {XX 小 算 出 的 人 与 58% 同 分 布 ,而 >5%。 由 
此 知 ; 5% 有 更 大 的 可 能 性 首先 从 (3.117) 式 下 面 的 图 形 的 log B 一 边 越 出 图 
中 的 带 形 )。 
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第 四 章 区 间 估 计 


设 样本 于 的 分 布 包含 未 知 参 数 0EB, 而 g(9) 是 定义 在 @ 上 
的 一 个 已 知 函数 ， 要 利用 样本 和 对 g(9) 进 行 估计 ， 这 个 问题 在 
第 二 章 中 已 讨论 过 了 。 在 那里 , 我 们 是 用 一 个 由 样本 忆 所 决定 的 
数 9(z) 去 估计 g(9), 称 为 g(9) 的 点 估计 ， 这 种 估计 的 缺点 在 于 ， 
单 从 所 给 出 的 估计 值 9( 下 ) 上 ,无 法 看 出 它 的 精度 有 和 多大， 当然 ， 
你 可 以 给 出 基 种 指标 , 例如 估计 的 均 方 误差 之 类 去 刻 划 这 种 精度 ， 
但 这 也 还 只 是 间接 的 . 更 直接 的 方法 , 就 是 指出 一 个 误差 限 4( 王 ) 
而 把 估计 等 成 多 垃 ) 十 民生) 的 形式 ， 在 各 种 部 门 中 我 们 常见 到 
这 种 写法 . 这 事实 上 就 是 一 种 区 间 估 计 : 估计 g(9) 在 区 间 [9( 子 ) 
一 红斑 ), 9( 节 ) 十 4( 及 之 内 . 

一 般 地 , 设 有 两 个 统计 量 4( 邓 ) 和 B( 驰 ), 满 足 条 件 4()<< 
B( 尽 ), 则 [4( 脏 ), B( 玉 J] 就 可 作为 g( 四 的 一 个 区 间 估 计 ， 意思 
是 : 一 旦 有 了 样本 对， 就 把 未 知 的 9(9) 鸽 计 在 区 间 [4CXX) 
B( 于 站 内 、 

在 有 些 实际 问题 中 ， 人 们 关心 的 只 是 g(0) 在 一 个 方向 的 界 
限 ， 例 如 一 种 新 材料 的 强度 , 我 们 关心 它 最 低 不 小 于 多 少 ; 一 个 工 
厂 的 废品 率 , 我 们 关心 它 最 高 不 超过 多 少 等 等 。 这 也 是 一 种 区 间 
估计 ,因为 ,车 用 9 全) 作为 g(9) 的 上 界 估 计 . 则 等 于 说 把 g() 估 

计 在 区 间 ( 一 ce, g( 卫 J 内， 同样 ， 下 界 g( 访 ) 相 当 于 区 间 合 计 
fg(), 00). 

区 间 估计 是 一 种 很 重要 的 统计 推断 形式 ， 在 再 论 上 说 , 它 也 
是 数理 统计 学 中 一 个 各 家 争论 较 多 的 问题 。 争论 的 焦点 在 于 , 对 
区 间 估 计 问 题 的 意义 究 应 如 何 理解 。 由 于 这 种 理解 的 不 同 , 所 引 
出 的 方法 也 就 有 差异 . 就 目前 情况 来 说 ， 占 主导 地 位 的 ， 还 是 
J. Neyman 在 1934 年 开始 的 一 系列 工作 中 所 引进 的 置信 区 间 理 
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沦 。 本 章 将 对 这 个 理论 的 基本 概念 , 以 及 车 二 重要 参数 的 区 间 佑 
计 , 作 一 简短 介绍 ， 本 章 8$ 4.2 打算 介绍 一 个 Fisher 关于 区 间 估 
计 的 观点 -一 信任 推断 法 ， 关于 用 Bayes 方法 作 区 间 估 计 的 介 
绍 则 放 到 下 一 章 , : 


$4.1 Neyman 的 置信 区 间 理 论 


(一 ) 置信 水 平和 置信 系数 
为 书写 简单 计 , 假定 被 估计 的 9(9) 就 是 0 本 身 ， 一 般 情 况 没 
有 原则 区 别 . 
设 为 样本 , [0( 王 )，0a( 交 )] 是 和 的 一 个 区 间 估 计 . 由 于 0 
未 知 且 样本 是 随机 的 , 我 们 不 能 保证 在 任何 情况 下 ( 即 对 任何 具体 
的 样本 值 ), 区 间 [91( 导 ), 0s( 于 必定 包含 被 估计 的 9, 而 上 只 能 以 
一 定 的 概率 保证 它 ， 这 个 考虑 引出 下 面 的 基本 定义 ， 
定义 4.1 如 果 不 论 参数 0 在 参数 空间 6 中 取 什 么 值 ,“ 区 间 
[91:( 脏 )，0s( 驻 )] 包 含 9 这 个 事件 的 概率 ， 总 不 小 于 指定 的 常数 
1 一 a(0<a<1l, a 通常 很 小 ), 即 
P,(0(X)E<OLO(T)) 1—a, 一 切 2EB， (4.1) 
则 称 [91( 且 ), 9s( 邓 有 置信 水 平 1 一 wa。 也 常 称 [91( 尺 ), 9s( 脏 )] 
是 日 的 置信 水 平 1 一 a 的 区 间 估 计 或 置信 区 间 . 
由 此 定义 可 知 ,车 1 一 0 为 置信 水 平 ,而 0 才 a<a'<1, 则 1 一 oe 
也 是 署 依 水平. 一 切 置信 水 平 中 的 最 大 者 称 为 置信 系数 . 易 见 ， 
` 184( 了 对), 9s( 玉 )] 的 置信 系数 是 inf{Po(0( 了 了)<0<0s(X)):0€ 
0}. 
如 果 (及) 二 一 00, 或 纪 ( 卫 ) 三 oo, 则 相应 地 得 到 9 的 上 、 下 
界 估计 ， 与 此 相应 ,有 
定义 有 .2 设 寻 ) 是 86 的 一 个 上 界 估 计 ,0<a<1， 车 
Ps(9<0( 了 TT))>1-o,C— 切 0€0, (4.2) 
则 称 1 一 a 为 民有 对 ) 的 置信 水 平 ， 也 常 称 95( 对 ) 为 6 的 置信 和 水平 
1 一 wa 的 置信 上 界 ( 或 上 限 )、 如 前 , 一 切 置 信 水 平 中 的 最 大 者 称 为 
. 165 ， 


置信 系数 . 
对 下 界 估计 情况 完全 类 似 ; 车 
Po(8( 了 ) 入 由 六 1 一 o 一 切 OEG@， (4.3) 
称 &( 筷 ) 为 b 的 置信 水 平 I--w 的 置信 下 界 (或 下 限 ). 

(4.2) 式 的 解释 是 这 样 的 : 车 以 区 王 ) 作 为 和 的 上 界 , 则 也 可 
能 出 错 ; 即 实 际 上 有 0>0( 肚 )(0( 脏 ) 非 9 的 上 界 ), 但 这 种 情况 发 
生 的 概率 不 超过 a. 

以 上 假定 参数 9 是 一 维 的 .车 9 是 维 而 X 汪 1， 则 可 定义 其 
区 域 估计 , 即 一 个 由 样本 下 决定 的 区 域 S()CR*， 意 即 一 旦 有 
了 样本 肚 ， 就 把 9 估计 在 区 域 8S( 卫 ) 内 ，S( 对 ) 一 般 有 比较 规则 
的 形状 ,例如 其 各 面 与 坐标 面 平行 的 长 方 体 、 球 、 椭 球 等 等 、 置 信 
水 平和 置信 系数 的 定义 依旧 ， 例 如， 车 Pel(0ESC 邓 )) 之 1 一 a 对 
一 十 eee, 就 称 1-a 是 SC 下) 的 置信 水 平 ， 也 说 SC( 卫 ) 是 9 的 
置信 水 平 1 一 a 的 置信 区 域 . 

置信 水 平和 置信 系数 的 概念 是 Neyman 区 间 估 计 理 论 的 基本 
概念 ， 这 个 概念 的 要 点 在 于 , 被 估计 的 参数 9 虽然 未 知 , 但 是 是 一 
个 常数 ,没有 随机 性 ,而 区 间 [91( 怀 ), 93( 王 )] 则 是 随机 的 ， 因 此 ， 
这 个 概念 允许 一 种 频率 的 解释 ， 如 果 把 这 个 区 间 估 计 反 复 使 用 许 
多 次 ;, 则 有 时 它 包 含 9, 有 时 不 包含 。 当 次 数 充分 大 时 ， 包 含 g 的 
频率 接近 于 置信 系数 因此， 一 个 置信 系数 为 0.95 的 区 间 估计 
[91( 王 ), 09s( 圣 )]， 其 实际 意义 可 理解 为 , 当 把 [901( 叉 ), 0a( 肝 1 
使 用 100 次 时 , 平均 约 有 95 次 ， 其 结果 是 正确 的 , 即 包含 了 被 估 
计 的 0. 

构造 置信 区 间 的 方法 主要 有 两 种 。 一 种 是 从 点 估计 出 发 ,一 
种 是 从 假设 检验 出 发 ， 在 一 些 常见 的 重要 问题 中 , 这 两 种 方法 往 
往 给 出 同一 结果 ， 下 面 我 们 就 来 讨论 这 些 方法 . 


(二 ) 通过 点 估计 量 构造 置信 区 间 
我 们 举 几 个 例子 来 说 明 这 个 方法 . 
例 4.1 设 故 1， 四 到。 是 抽 自 一 总 体 的 独立 随机 样本 ， 总 体 
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分 布 为 指数 分 布 (1.8)， 给 定 wm 找 参数 和 的 置信 系数 1 一 “的 于 
信 区 间 和 置信 上 、 下 界 . 


因为 素 = 却 六 碟 , 是 元 的 一 个 无 偏 信 计 ( 且 是 其 UMVUB)， 
我 们 设想 X 的 区 间 佑 计 能 通过 总 表 出 来 ， 因 为 习 和 ,有 概率 密度 


(1.20)， 由 此 并 注意 到 w? 分 布 的 密度 (4.28)， 不 难 推出 Mm 对 ~ 
x2»。， 于 是 ,车 找到 w 5, 0<a<5 过 oo0, 满足 条 件 
P(g<xi 0)=1—o, (4.4) 
则 有 
P(a/n¥<N<b/n) =1—o,—W ,>0. (4.5) 
由 (4.5) 知 , [s/n 及 , 5/n 及 1] 就 是 和 的 置信 系数 1 一 a 的 置信 区 间 . 
它 不 是 唯一 的 ,一 则 满足 条 件 (4.4) 的 4, 2 有 很 多 , 二 则 也 可 以 设 
想 ,不 从 下 出 发 同样 可 构造 和 的 区 间 估 计 ， 这 样 就 发 生 一 个 如 何 
在 许多 具 同 一 置信 系数 的 区 间 估 计 中 选择 其 一 的 问题 、 这 问题 到 
(四 ) 中 再 谈 , 此 处 可 考 虚 选 择 w, 5 满足 (4.4) 并 使 5 一 ga 最小， 这 


” 样 的 a.b 也 不 容易 决定 ,实用 上 可 行 的 方法 是 取 


一 xX (1-&), 5 二 x (#£). 
类 似 地 ， 由 了 P(x 纹 宇 x2,(1 一 0) ) 一 P(x 纪 忆 x2n(0)) 一 1 一 ag， 分 别 得 
出 和 的 置信 系数 1 一 a 的 置信 下 、 上 界 分 别 为 x1 一 a)/n 玉 和 
X20) /nn 及. 


例 &.2 设 工 ,，…, 且 ,~R(0, 9), 0>0， 找 9 的 置信 系数 


1 一 a 的 置信 区 间 和 置信 上 、 下 界 . 
我 们 知道 ， 若 记 四 一 max( 和 :，…, 下 0)， 则 卫士 二 全 是 9 的 


UMVUE( 例 2.16)、 因 此 ,设法 去 找 通 过 下 表 出 的 区 间 估 计 . 因 
为 卫 1/0~R(0, 1), 由 (1.25) (在 其 中 取 m 一 %, jz) 一 二 (2) 一 
»), 知 了 /0 有 密度 函数 nw"! ( 当 0<w< 之 1, 其 他 处 为 0)。 于 是 , 车 
找 ou co，0 和 ci 和 css1， 满足 条 件 | 

1—a~ | nodo=o 一 (4.6) 
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则 将 有 Po(crsZVO<ca) 一 一 os 即 
了 e( 了 /cs 和 0 过 了 /oa ) =1]—o, 0>0. (4.7) 
于 是 [TD 了 /es, 7/edj 为 9 的 一 个 置信 系数 1 一 a 的 置信 区 间 . 要 在 


0-<<c<e<i 的 范围 内 取 c1、 ca, 使 (4.6) 成 立 ， 并 使 到 -元 尽 可 


能 小 (以 使 置信 区 间 最 短 )。 不 难 证 明 : 这 要 求 取 ci 一 oa ol. 
置信 上 、 下 界 的 问题 留 给 读者 . 

在 以 上 两 例 中 , 我 们 依据 的 都 是 确切 的 分 布 , 因此 , 作出 的 区 
间 信 计 , 其 置信 系数 也 是 确切 的 .有 时 ,确切 的 分 布 无 法 找到 或 过 
于 复杂 不 便 应 用 . 这 时 ( 当 样 本 大 小 较 大 时 ) 可 使 用 其 极限 分 布 ， 
但 所 得 的 区 闻 佑 计 , 其 置信 系数 也 只 是 近似 而 非 确切 . 

例 4.3 设 耻 1,…, 了 ,是 抽 自 具 Cauohy 分 布 的 总 体 的 独 
立 随机 样本 ,Qauchy 分 布 有 密度 函数 


fl%, ) ~ 让 -本 oo, 一 co<0<oo， 
(4.8) 


要 作 8 的 区 间 估 计 . 

以 mm 记 了 1 … ,她 , 的 样本 中 位 数 。 因为 8 是 分 布 的 对 称 中 
心 ，”ms 一 9 的 分 布 与 从 4 一 0 时 的 Cauchy 分 布 中 折 昌 的 样本 (大 
小 为 四) 的 中 位 数 的 分 布 相同 ,因此 , 这 个 分 布 的 密度 函数 户 (x) 与 
9 无 关 .。 当 % 为 奇数 时 ,， 户 (2) 的 表达 式 不 难 利用 公式 ( 荆 .25` 直 接 
写 出 来 . 当 ? 为 偶数 时 要 复杂 些 ， 但 原则 上 并 无 困难 .找到 f(z) 
后 , 找 c>0, 使 

| fr(2)dr =—1—o, (4.9) 

则 Poelms 一 0| 志 c) 一 1 一 wm， 对 一 切 9， 由 此 得 出 0 的 一 个 导入 系 
数 1 一 a 的 置信 区 间 为 [m6 一 6, ?mw 十 6]. 

但 是 ,因为 有 (zw) 的 表达 式 很 复杂 ， 要 由 {4.9) 决 定 c 不 容易 , 
但 根据 (1.36) 式 , 知 当 n->co 时 , Vw (ms 一 90) 有 极限 分 布 信 (0， 
mw?/4). 因 此 当 % 较 大 时 , (4.9) 中 的 6 可 近似 地 取 为 mwsjs/2V m ， 
区 闻 估 计 mn 士 wuaya/2 Mm 的 置信 系数 近似 地 为 1 一 a( 当 %->co 
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时 , 趋 于 1 一 @). 
例 4. 和 4 于 ~B(m, p), 找 pp 的 区 间 信 计 ， 2 是 某 事件 的 概率 ， 
而 广 是 在 % 次 独立 重复 试验 中 该 事件 发 生 的 次 数 ， 于 /mn 为 频率 . 
这 个 问题 在 历史 上 以 “ 道 概率 问题 ”的 名 称 而 知名 (“ 正 问 题 " 是 指 
已 知 概率 p 去 计算 发 生 各 种 次 数 的 可 能 性 大 小 ). 
取 了 一 (于 -np)/Mnp9 ,9 一 1 一 p.， 了 的 分 布 仍 与 p 有 关 , 因 
此 直接 按 以 上 几 个 例子 处 理 行 不 通 ， 但 当 w%w->co 时 , 也 的 分 布 趋 
问 于 六 (0 了 的 分 布 。 因 此 当 充分 大 时 近似 地 有 
PIT|<ua)T1-a ， (4.10, 
现在 要 把 不 等 式 | 了 |<<wys 改写 成 cl 生 ps 和 cs 的 形状 ,ct oa 与 Pp 无 
关 . 若 能 得 到 这 样 的 C1, C9) 则 由 (4.10), 有 
P(e p01—o, (4.11) 
于 是 fer, ca] 可 和 作为 p 的 置信 区 间 ， 置 信和 系数 近 似 地 为 1 一 a。 记 
2 一 六 /ng 二 1 一 p*,， Was 二 入， 不 难 解 出 
01, ott+) (ci 相应 负 号 ). 
(4.12) 


置信 上 下 界 也 可 类 似 求 得 (上 界 在 (4.12) 中 取 正 号 ， 下 界 取 负 号 ， 
且 入 要 改 为 Wa). . 


(三 ) 通过 假设 检验 构造 置信 区 间 
方法 很 简单 . 设 要 作 8 的 置信 系数 1 一 a 的 置信 区 间 . 考 卡 检 
验 问题 : 
H.0=0 © K.0#00, (4.18) 
找 出 (4.18) 的 一 个 检验 ， 它 的 术 平 为 a。 设 这 个 检验 有 接受 域 
46。, 即 当 梓 本 天 Ed4o 时 控 受 五 ,不 然 就 否定 瑟 。 则 有 
- Po (FEdo) 1—a, OEO. (4.14) 
如 果 关 系 { 王 E46} 可 改写 成 等 价 的 形式 {组 ( 卫 ) 寺 Oo<0s( 素 )}， 
列 由 (4.14) 可 得 Pe,( 负 (于) 志 抽 性 Bs( 玉 )) 之 1 一 me， ， 改 0 为 0, 得 
PO(BF)I<OISO(R)) >1—a, 0€08. (4.15) 
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(4.15) 表 示 ，[91( 玉 ), 9s( 耻 )] 是 9 的 一 个 轩 信 水 平 1 一 a 的 区 间 
估计 ， 车 检验 的 真实 水 平 为 w 则 (4.14) 可 改 为 等 号 , 因而 (4.15) 
也 可 改 为 等 号 , 故 [0:( 肚 ), 0,( 玉 )] 有 置信 系数 1 一 

如 果 要 作 的 是 9 的 置信 上 、 下 限 , 就 需要 考虑 单 边 假设 0<bs 
或 者 单 边 假设 9 之 0。 的 检验 问题 ， 这 些 我 们 都 将 在 下 面 通过 例子 
说 明 . z 

例 和 .5 环卫 N(a 9，w 0 都 未 知 , 要求 4 和 0 
的 置信 系数 1 一 wx 的 嘻 信 区 间 和 置信 上 、 下 界 ， 

先 考 虑 4 的 问题 .在 $ 3.6( 二 ) 中 已 给 出 了 假设 及; g 一 ao 的 
t 检验 ， 接 受 域 为 1 元 ( 台 -ao)1MS<t-i( 受 半 ， 此 处 立 和 
8? 分 别 为 样本 均值 和 样本 方差 、， 上 述 不 等 式 可 改写 为 下 一 
(入 )S / wm <ao< 了 +t-i( 全 )8 /Vw 根据 前 面 的 讨 
论 ， 知 | 
[Bb (g)S /V, Rtg)S /Vw)| (416) 
是 “的 一 个 置信 系数 工 -wx 的 置信 区 间 ， 它 称 为 一 样本 蕊 区间 估 
计 . 

若 要 找 “ 的 置信 下 界 , 则 考虑 万 ,a<ao 的 检验 .在 $ 3.6( 二 ) 
中 也 给 出 了 它 的 水 平 a 的 t 检验 ， 有 接受 域 {Vn( 叶 一 m0)/S< 

加 -1(0)}。， 此 不 等 式 可 改写 为 {mo 之 时 一 加 -1(o)8/NV m}, 于 是 有 
Pos(ao> -ao) SB/V n) 
一 Po(w/ ma (一 a0)/S < 1(0)) 
一 圭一 0 
此 式 对 一 切 ao 成 立 . 改 0 为 4, 得 出 , 于 一:(o)8/V 世 是 4 的 
一 个 置信 系数 1 的 置信 下 界 ， 同样 , 考虑 检验 问题 也 :4 之 ao， 
可 得 < 的 置信 系数 1 一 a 的 置信 上 界 为 及 十 如 -1(@)S/V mn. 

o? 的 置信 区 间 和 置信 上 下 界 ， 通 过 考虑 rc? 一 cg、o*>>og 和 
oa< cg 的 检验 得 到 ， 在 $3.6( 六 ) 中 ， 已 求 得 这 些 假设 的 水 平 a 
的 接受 域 分 别 为 

。 170. 


{2 (1 ) < -DSsoyag< 人 (全 外 
fa 一 1DSe/as> Na 一 四 }， 
[一 DS%/ci<x2ai(a}， 
由 此 得 到 oa 的 置信 系数 1~« 的 置信 区 间 和 置信 上 下 界 分 别 为 


[Ds / ss(), 0-D5/ #1 各)] 
(mn—1)S/x211—o), (n—1)S/xr-1C0). 
例 4.6 有 i, …, Xn~NG, oo), YI, 1, FY.~N(GD,'o’), 
且 合 样本 昼 1，…， 了 玉 m, 了 1,…，, 了 相互 独立 . 令 9=5 一 g.。 找 绰 
的 置信 系数 1 一 a 的 置信 区 间 与 上 下 界 . 
在 83. 和 中 已 找到 了 0=0o0>>b 和 0 加 等候 设 的 两 
本 # 检 验 . 


ro y+ 7 
得 到 9 的 置信 系数 1 一 a 的 置信 区 间 和 上 下 界 分 别 为 
[¥- 丈 ) -和 (各 )V za S*, 


(一 丈 )-FHtosn-a{( 立 ) mn 8"|， (4.17) 


mn 


(一 已) 二 toswra(a) VS (上 界 ) (4.18) 


(一 六 ) -- 知 ra(a) VB， (下 界 ) (4.19) - 


与 检验 问题 一 样 ， 这 里 我 们 假定 了 两 总 体 有 相同 的 方差 0 。、 
车 去 掉 这 个 假设 , 则 得 到 著名 的 Behrens-Fisher 问题 的 区 间 佑 计 
形式 (检验 形式 已 在 $3.6( 四 ) 中 提 到 过 了 )。 我 们 将 在 $4.2 中 
ey 
态 总 体 方差 之 比 的 置信 区 间 和 上 下 界 ， 也 可 以 用 同样 的 
方法 得 到 明 $3.6( 六 ) 的 结果 )， 细 节 留 给 读者 . 
反 过 来 ,车 我 们 用 茶 种 方法 建立 了 4 的 置信 水 平 为 1 一 a 的 区 
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间 舍 计 [0:( 圣 ), 8s 对)]， 则 对 给 定 的 6o, 不 难 作 出 (4.187 的 一 个 
水 平 w 的 检验 ， 事 实 上 , 以 {fz: goE [91(%)，0s(w)]} 为 否定 域 的 检 
验 就 是 这 样 一 个 检验 , 证 明 是 显然 的 ， 由 此 可 兄 , 区 间 佑 计 和 假设 
检验 之 间 有 很 密切 的 关系 。 这 种 关系 不 止 是 形式 上 的 . 事实 上 ， 
某 种 准则 下 的 最 优 检验 , 往往 导致 相应 准则 下 的 最 优 区 间 估 计 . 反 
之 亦 然 ， 后 面 将 更 具体 地 谈 到 这 一 点 . 

与 点 估计 和 假设 检验 比较 ， 区 闻 估 计 这 种 推 斯 形式 有 一 个 显 
著 的 特点 , 即 它 的 精度 (一般 可 用 区 闻 的 长 度 刻 划 ) 和 可 靠 度 ( 用 其 
置信 系数 刻 划 ) 一目了然 ， 有 如 本 章 开 始 时 指出 的 , 正 是 因为 点 佑 
计 不 有 具备 这 个 特点 , 才 使 人 们 考虑 区 间 估 计 , 假设 检验 也 有 这 个 问 
题 。 考 虑 这 样 一 个 例子 

设 从 正 态 总 体 (ac, co?) 中 抽 了 一 些 衬 本 去 检验 假设 一 0， 
结果 假设 被 接受 了 .如 以 前 曾 指出 的 , 这 并 不 意味 着 “证 明了 ”a 
0. 而 且 , 假如 我 们 只 是 收 到 通知 说 4 一 0 被 接受 了 ,我们 甚至 无 法 
估量 真正 的 a 值 与 9 相去 能 有 多 远 ， 但 如 我 们 被 告知 ，& 的 其 一 
定 置信 系数 (如 0.95) 的 区 间 估 计 为 [-0.05, 0.07]， 或 者 是 
[一 15, 20], 则 在 前 一 场合 , a 与 0 相距 最 大 不 过 0.07, 这 么 大 小 
一 个 值 在 实用 上 可 能 无 其 影响 . 这 时 , 我 们 就 有 一 定 把 所 (0.95) 说 
"事实 上 ”可 认为 是 0, 而 不 止 是 “接受 ge 一 0" 了 . 若 在 后 一 场合 , 虽 
则 a=0 这 个 假设 也 被 接受 (因为 0 这 个 点 在 区 间 [ 一 15，20] 内 )， 
但 因 & 的 可 能 范围 很 大 , 实际 上 我 们 只 能 说 对 a“ 所 知 其 少 ”, 

反之 , 若 我 们 收 到 通知 说 “6 一 0 被 否定 ”我们 从 这 和 句 话 也 只 
知道 ， 有 比较 显著 的 证 据 认 为 "类 0, 但 还 无 法 知道 其 实际 意义 如 
何 . 但 如 我 们 被 告知 ,ex 的 区 间 估 计 为 [0.01，0.03], 或 为 [一 50， 
一 40]. 在 前 一 场合 ， 虽 则 a-=0 被 否定 ( 因 0 不 在 区 间 [0.01， 
0.08] 内 ). 但 a 最 大 也 不 过 0.08, 这 么 小 一 个 值 可 能 实际 上 与 0 
无 异 . 因此 , 虽 则 在 统计 上 否定 了 4 一 0, 事实 上 可 认为 a 一 0. 在 
后 一 场合 ,不 仅 4 一 0 要 否定, 而且, eg 之 值 至 少 与 0 相距 40, 因而 
从 实际 意义 上 看 也 是 显著 异 于 0. 这 些 分 析 说 明 , 区 间 估 计 所 提 
供 的 信息 比 假设 检验 更 为 确切 些 。 也 提醒 我 们 : 1. 在 实用 上 , 对 
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假设 检验 的 结果 的 实际 含义 的 解释 , 要 多 小 心 。 2. 必要 时 , 要 参 
考 被 检验 的 参数 的 区 间 佑 计 . 


(四 ) 区间 估计 的 优良 性 准则 

评价 一 个 区 间 信 计 的 优 劣 有 两 个 要 素 . 一 是 其 可 靠 度 , 即 区 间 
包含 未 知 参 数 的 概率 有 多 大 ， 当 然 愈 接近 工 愈 好 ; 二 是 其 精度 , 衡 
量 精 度 指 一 个 明显 指标 是 其 长 度 ， 长 度 您 小 愈 好 在 样本 大 小 一 
定 的 情况 下 , 这 二 者 是 矛盾 的 。 若 把 可 靠 度 提 得 极 高 , 则 区 间 长 无 
痕 增加 ， 而 结果 变 得 无 用 。 正如 把 一 个 人 的 年 龄 估 在 10 岁 到 90 
- 岁 之 间 , 虽 则 可 靠 但 于 事 无 补 .” Neyman 的 理论 给 定 置信 水 平 , 以 
保证 有 一 定 的 可 上 靠 度 , 在 这 个 前 提 之 下 ,尽量 选择 精度 哆 高 的 区 间 
舍 计 . 

用 长 度 作为 精度 的 标准 不 适用 于 置信 上 、 下界 。 就 区 间 估 计 
而 言 ， 以 长 庆 作 标准 的 理论 也 比较 复杂 些 。 因此 又 引进 了 另外 的 
标准 .我 们 先 从 置信 上 .下 界 谈 起 . 

设 8( 及 ) 为 9 的 置信 水 平 1 一 oa 的 置信 下 界 。 在 满足 规定 的 
置信 水 平 的 前 提 下 ,&( 工 ) 愈 大 愈 好 ， 或 者 说 ,QZ ) 愈 大 ， 它 作为 
9 的 下 界 就 愈 精 ， 正 如 说 : 甲 估计 4 的 年 龄 庆生 岁 , 乙 估 计 4 的 
年 龄 这 40 岁 , 则 里 的 估计 比 乙 精 ， 指 定 任 一 个 8<0.24S ) 愈 大 ， 
9' 落 在 [@CX)，co) 内 的 机 会 就 愈 小 ， 反 之 亦 然 ， 因 此 , 我 们 要 在 
一 定 的 置信 水 平 的 限制 下 , 找 这 样 的 8 了 ), 使 对 任何 <90, 概率 
Pi(2( 了 IJ)< 生 9) 尽 可 能 小 ， 类 似 地 ,对 置信 上 界 0 了 芝 ), 要 求 当 信 > 
0 时 , Po(5( 和 ) 关 的 ) 小 ; 对 置信 区 间 [6:( 和 )，pa( 开 四 ,要 求 对 任何 
0' 基 0, 概率 Po(0 (和 )< 和 0 入 (和 )) 尽 量 小 ， 这 些 考虑 引导 到 下 
面 的 定义 : 

定义 人 .2 称 术 (于 ).*( 卫 ) 和 [ 织 ( 斑 ), 绑 ( 及 站] 分 别 是 9 的 
晋 信 水 平 1 一 a 的 一 致 最 精确 CUMA-Uniformly Most Acourate) 
置信 上 .下界 和 置信 区 间 , 如 果 它 们 有 置信 和 水平 1 一 a 而 且 . 

1. 对 任何 置信 水 平 为 1 一 a 的 置信 上 界 0 及), 以 及 任何 9< 
0', 有 Po((X)20) P(X)>0). 

。 173. 


2. 对 任何 置信 水 平 为 1 一 a 的 置信 下 界 (于 )， 以 及 任何 90> 
9, 有 PAO(X)EO) SEPAO TT) EO). 

3. 对 任何 置信 水 平 为 1 一 a 的 置信 区 间 [64( 邓 ), 9a( 下 )]， 
以 及 任何 0 二 8， 有 PeGi(X)<0 人 < ))EPoO (TT)<O < 
ga( 革 )), 

下 面 的 定理 指明 由 UMP 检验 构造 UMA 置信 上 、 下 界 和 置 
信 区 闻 的 方法 . 

定理 1 在 第 (三 ) 段 中 讲 过 的 , 通过 由 假设 9 一 0o.0>>go 和 
0<ob 去 构造 9 的 置信 水 平 1 一 x 的 置信 区 间 和 置信 上 、 下 限 的 方 
法 中 ,车 所 用 的 检验 是 水 平 a 的 UMP 检验 , 则 所 得 的 置信 区 间 和 
置信 上 、 下 界 是 置信 水 平 1 一 a 的 UMA 置信 区 间 和 置信 上 、 下 办 ， 

证 以 置信 下 界 为 例 , 其 余 情况 类 似 . 

设 { 了 E44"(00)} 为 0<00e39>0 的 水 平 a 的 UMP 检 验 ， 其 
产生 的 置信 下 界 记 为 6"( 昼 )， 前 已 指出 它 有 君 信 水 平 1 一 a (参看 
例 4.5, 4.6). 现 设 8() 为 另 一 置信 下 界 , 有 置信 水 平 1 一 a。 引 
进 0<boey0>bo 的 检验 ， 它 有 接受 域 {To: 8Cw)<0o}, 则 其 水 平 为 
wz。 事实 上 , 若 原 假设 成 立 , 即 g 生 2o， 将 有 Po( 原 假设 被 接受 ) = 
Pe(Q()<<00o) 之 Po(0( 叉 )<9) 之 1 一 ,这 证 明 它 有 水 平 a. 但 以 
“(06) 为 接受 域 的 检验 是 水 平 a 的 UMP 检验, 按 UMP 检 验 的 
定义 ,对 任何 和 > 如 ,有 

Ps,(XEA(0))PP,.(O(F)>0), 
即 Po(XEA"(00))<Po(Q(TZ) EN). 人 {FEA} =- {0 (LT) 
0}, 改 Pa(( 庆 ) 所 00) 志 Po(8( 广 ) 专 如)。 此 式 对 任何 彤 > 加 
成 立 、 改 ,为 9 为 0, 得 
Te 人 JSO ssPe(C2(Z)<2) ,任何 0 一 0. 
这 证 明了 人 入 ( 羡 ) 为 UMA 置信 下 界 . 定理 证 毕 . 

UMP 检验 不 常见 , 故 UMA 置信 上 、 下 界 和 警 信 区 间 也 不 党 
见 . 但 由 定理 4.3, 对 指数 型 分 布 族 而 言 , 单 边 假设 的 UMP 检验 
存在 。 这 时 可 以 找到 其 UMA 置信 和 界 ， 举 一 个 简单 例子 

例 和 人 .7 1 pw 1)，0 志 加 90>>06 的 水 平 a 的 

» i?4。 


UMP 检验 存在 ， 且 有 接受 域 {Vn (于 一 90) <us}。 这 相应 于 9 的 
置信 下 界 及 一 us/V w， 据 定理 4.1， 这 是 9 的 置信 水 平 1 一 a 的 
UMA 置信 下 界 . 同 理 , 全 +us/MVw 是 0 的 置信 水 平 1 一 ax 的 
UMA 置信 上 界 . 

由 于 双边 检验 问题 9 一 人 9 天 的 的 UMP 检验 几乎 总 不 存 
在 , 故 UMA 置信 区 间 几 乎 总 不 存在 ,对 指数 型 分 布 族 和 参数 也 不 例 
外 (以 此 之 故 ,定理 4.1 中 关于 置信 区 闻 那 部 分 基本 上 是 虚设 的 )， 
即使 对 单 边 检验 问题 ，UMP 检验 存在 的 情况 也 不 多 ， 因 此 ,对 优 
良性 准则 要 加 以 适当 的 放宽 . 为 此 , 引进 无 从 置 信 区 间 与 无 偏 置 
信和 界 的 概念 . 
定义 4.8 [91( 及 ), 9s( 卫 )].(X) 和 QC 于 ) 分 别称 为 9 的 无 
偏 置 信 区 间 与 无 偏 置信 上 .下 界 , 若 ， 

1. 对 任何 9 和 "六 9, 总 有 

Poy(O (XIE<OEO (RPo (0 (TI) EO < T)); 

2. 对 任何 久 和 0 <O” ,总 有 

Po(BOX)>0)>Po(RR)>0"); (4.20) 
3. 对 任何 六 和 29"'>>0"”, 总 有 
Py (OT)<O)FPo (Q(T EO"). 

总 之 ,无 偏 性 条 件 的 意思 是 说 ， 它 包含 (或 忆 ,或 所 )“ 应 当 包 含 ( 或 
应 之 ,或 应 <) 的 人 入” 的 概率 不 能 小 于 它 包含 (或 >, 或 <)“ 不 应 包 
含 ( 或 这， 或 迄 ) 的 值 ” 的 概率 ， 例 如 ,在 (4.20) 的 左边 ,& 是 参数 
真 值 , 6( 瑟 ) 基 20， 9( 邓 ) 作 为 0 的 上 界 估计 ,是 应 当 宇 9、 再 看 右 
边 .9" 是 参数 真 值 ,5( 瑟 ) 作 为 其 上 界 估计 , 愈 小 您 精 。 故 引 ) 不 
应 之 比 9" 大 的 值 0 

在 这 个 定义 的 基础 上 ， 自 然 地 就 导出 一 致 最 精确 的 无 偏 
(UMAU) 置 信 区 间 和 上、 下界 的 概念 。 它 是 在 一 切 具 置信 和 水平 
1 一 w 的 无 偏 置信 区 间 ( 上 、 下 界 ) 中 ， 在 定义 4.2 的 意义 下 一 致 最 
精确 者 . 

与 定理 完全 类 似 的 证 法 不 难得 到 下 述 定 理 . 

定理 4.2 在 第 (三 ) 段 中 讲 过 的 ， 用 有 关 检 验 所 构造 的 置信 
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系数 1--a 的 置信 区 间 C( 上 .下 限 ) 时 ,车 所 用 检验 为 无 篇 的, 则 所 得 
置信 区 间 ( 上 .下 限 ) 也 无 偏 ; 着 所 用 检验 为 UMPEU, 则 所 得 置信 区 
间 ( 上 ,下限 ) 也 是 UMAU. 

例 4.8 设 革 1,…, 及,~N(g, o”), go、o 都 未 知 由 例 4.5 
所 构造 的 .a 的 置信 区 间 和 置信 有限 ,都 是 UMAU 的 ， 因 为 在 $3.6 
中 我 们 曾 措 出 (未 证 )， 导 出 它们 的 检验 一 一 一 样本 t 丛 验 ， 为 
UMPU 的 .同样 , 例 4.6 作出 的 两 正 态 总 体 均 值 差 5 一 a 的 置信 区 
间 和 置信 限 ,也 是 UMAUD 的 ， 又 和 若 从 8 3.6 所 给 出 的 正 态 分 布 方 
差 的 无 偏 检 验 出 发 .去 构造 o 和 o3/03 的 置信 区 间 与 置信 限 ， 则 
都 是 UMAU 的 . 

最 后 我 们 注意 一 下 这 个 问题 ,前 面 在 由 JMP 检验 或 UMPU 
检验 去 构造 UMA 或 UMAU 置信 区 间 ( 或 上 、 下界) 时 , 我 们 所 考 
谋 的 都 是 检验 为 非 随 机 的 情形 . 车 UMP 或 UMPU 检验 为 随机 
的 (如 在 二 项 分 布 的 情形 ), 则 问题 比较 复杂 . 这 时 我 们 可 以 满足 于 
一 种 近似 解 ,也 可 以 用 一 种 随机 化 的 手续 表 出 其 精确 解 ,但 这 在 使 
用 上 不 方便 . 


(五 ) 序 贯 区 间 估计 

在 区 间 估 计 中 使 用 序 贯 抽样 的 方法 和 动机 ， 与 假设 检验 的 情 
形 相同 。 这 里 我 们 不 打算 进行 广泛 的 讨论 ,只 作为 例子 介绍 一 下 
C. Stein 的 一 个 重要 结果 . 

设 太 1， "°° .~N(a, 0o*), WO 都 未 知 ， 要 作 均 值 他 的 区 间 
估计， 给 定 置信 系数 1 一 w, 一 个 良好 的 区 间 估 计 是 由 (4.16) 所 给 
出 的 # 区 间 估计 。 这 个 区 间 估计 的 长 为 88-i( 笠 ) / V5， 如果 
固定 w 则 因 司 一/ 吝 (XZ, 一 及 )3/(w 一 1 可 以 取 任 意 大 的 信 ， 这 
区 间 之 长 不 能 有 界 ， 这 就 是 说 , 车 事先 给 定 一 个 常数 1， 则 不 论 把 
祥 本 大 小 % 取 得 多 大 , 不 能 保证 区 间 的 长 不 超过 1。 是 否 可 能 存 
在 济 的 区 间 信 计 , 霍 信 系数 仍 为 1-a, 但 具有 这 个 性 质 ? 1940 年 
Dantzig 证 明了 这 是 不 可 能 的 , 他 证 明了 不 论 给 定 怎 样 小 的 1 一 a 
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>0, 怎样 大 的 了 和 mn, 不 存在 @ 的 一 个 基于 互 1，…， 驻 的 区 间 舍 
计 , 其 置信 系数 之 1 一 而 区 间 之 长 总 不 超过 了 

如 果 o 已 知 , 则 对 任 给 的 1~a<1 和 71>0, 可 找到 n 充分 大 ， 
使 具有 上 述 性 质 的 区 间 估 计 存 在 . 事实 上 上 ，6 的 区 闻 估 计 芝 土 o 
xuws/ Vm 有 置信 系数 1 一 a 要 使 之 区 间 估 计 之 长 2owura/ wm 所 
5 只 须 取 (2cuara/1)3 就 够 了 ，ce 愈 大 ,所 须 的 也 愈 大 ， 由 此 
不 难 理解 ， 当 o 未 知 时 长 度 有 界 的 置信 区 间 ( 置 信 系数 大 于 0) 的 
不 存在 性 ,就 是 因为 o 可 能 非常 大 ， 以 致 任何 事先 指定 的 样本 大 
小 m 都 嫌 太 小 . 

1945 年 ,0. Stein 提出 了 一 个 两 阶段 抽样 法 ,构造 出 了 具有 上 
述 性 质 的 置信 区 间 . 他 的 想法 在 概念 上 很 简单 ; 在 o 已 知 时 ,我 们 
看 到 ,样本 大 小 %>(2cwwja/1)? 已 够 了 ， 当 o 未 知 时 , 我 们 先 抽 著 
干 个 样本 (第 一 阶段 抽样 ) 以 估计 oa， 根据 o 的 估计 值 , 看 需要 多 
大 的 m% 才 够 ,不 足 之 数 在 第 二 阶段 抽样 中 补 齐 , 现在 来 介绍 Stein 
的 方法 , 先 证 明 两 点 预备 事实 . 

(a) 设 mw 为 自然 数 , a?>0 为 常数 ,8? 和 了 都 是 随机 变量 , 满 
足 条 件 ，1° mS3/o?~x2。2? 在 给 定 S~=s 的 条 件 下 , 了 的 条 件 分 
布 为 N(0, o3/s”), 则 了 ~tn. 

只 须 利 用 公式 

Y 的 无 条 件 密度 一 j ( 的 条 件 密度 1S 一 s) (8 的 密度 )ds 
(4.21) 

由 假定 2", 被 积 函数 第 一 项 为 Br ez (- 和 又 由 ie 及 
x% 的 密度 形式 ,不 难 算出 8 的 密度 为 


m/a 9 
[及 /(0"T(B)] Yop(- Rs) 
( 当 s>0,s<0 时 为 0). 
以 这 些 代 入 (4.21) 并 算出 积分 ， 不 难得 到 : 了 的 密度 与 自由 度 m 
的 1+ 分布 密度 一 样 . 
(Cb) 设 和 1 瑟 ~ N(Ca aa 给 定 自然 数 m0, 令 
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-1 2 1 SS { _ 瑟 2 
有 去 站 8 一 Peg 于 0)?. (4.22) 


又 设 4( 引 .bP( 引 .wn( 人 都 是 给 定 于 0<ti<o0 的 函数 , a(t) 总 不 为 0， 
而 mi) 宕 m 取 整 数 为 值 , 则 有 


Sls) (于 ,一 @) 
Y= 一 一 一 一 一 一 
SW 六 of(S) 
此 处 m(S) =a(S) 当 ino mw(S) 一 508) 当 ma 
证 取 m~no 一 1， 由 定理 1,1 知 mS3/o?~x%, 故 (8) 的 条 件 
1° 满足 ， 把 了 写 为 
yY—— "8) (7 + 一 es 
8 /Si(s) S /SCs) 


nC 
| (及 ,0)=Y1+Y,. 


~ (4. 23) 


给 定 8S 一 s， 先 看 了 1, 根据 定理 1.1, 环 与 8 独立 ， 散 给 定 8 一 
时 ,了 1 的 条 件 分 布 与 


[aa /(s YS eC))] (Foo) 

的 无 条 件 分 布 相同 ， 即 为 (0, noo?ar(s) / (名 of(s)). 再 看 
Ys. 因为 有 全 只 与 至 1， ”5 及 有 关 ， 故 且 与 站 1 人 9 … 独 
立 , 因此 ， 在 给 定 一 s 时 ，Y3、 了 Ys 条 件 独立 且 了 s 的 条 件 分 布 为 
WO, (nCs) 一 m0)53(s) / (加 吝 2(s))， 由 此 可 知 , 当 给 定 驴 一 s 时 ， 
的 条 件 分 布 为 N(0，os/s)， 故 (a) 的 条 件 3" 也 成 立 ， 利 用 (3) 
得 (4.23). 

现 指定 c>0 及 自然 数 ro, 第 一 阶段 抽样 wo 次 得 下 1，…， 玉 。。 
系 。 和 8 的 意义 如 (4.22)， 定 义 

n(t) =max(no, [2/c] +1), ol) =B() =1/n(t), (4.24) 

车 mS) 一 mo， 则 抽样 到 此 为 止 。 车 m(8)>nmo， 则 第 二 阶段 再 抽 
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n(S) 一 mo 次， 即 观 察 卫 +z,…， Xnw， 令 
Y~V 8) (RF-o)/8, -i x 
则 由 以 上 的 预备 事实 (b), 知 六 ~， 于 是 置信 区 间 
[8 (&) / V nl), B+ Bi a G) / VS) | 

(4.25) 

有 置信 系数 1 一 o 此 区 间 之 长 为 2554 (如) / /了 57 .由 (4.29) 

知 w(8)>[8?/o] 十 1>8?/e， 故 区 间 (4.25) 之 长 不 超过 2V 5 

x 如 ( 生 ) 为 使 此 数 不 超 过 给 定 的 ?>0, 只 须 取 c=P (4 


(各)) 即 可 


$ 4.2 ”Fisher 的 信任 推断 法 


(一 ) 信任 分 布 

差不多 在 Neyman 发 表 其 置信 区 间 理 论 的 同时 , R. A. Fisher 
提出 了 一 种 求 区 间 估 计 的 方法 .这 个 方法 原则 上 可 用 于 任何 统计 - 
推断 问题 ,因而 它 不 仅 是 一 个 方法 上 的 问题 , 且 代 表 了 对 待 统计 癌 
题 的 一 种 根本 不 同 的 观点 ， 

Fisher 的 思想 可 以 通过 一 个 简单 例子 来 说 明 . 设 有 样本 焉 
~ 入 (6,1),0 是 未 知 参 数 ( 样 本 大 小 为 1)， 则 有 于 一 by~ NC0,1)， 
即 对 任何 实数 ,有 

P(X—0<H) = Bt), 50 -A {ey. (4.26) 
此 式 可 改写 为 、 
P(6> 卫 -人 =@(1)， 或 P(0<X-t)=1_$(0. 
(4.27) 
从 通常 的 概率 论 观点 看 , 由 (4.26) 到 (4.27), 不 过 是 写法 的 不 同 ， 
没有 什么 实质 性 的 新 内 容 ， 但 Fisher 却 赋予 (4.27) 这 样 一 个 意 
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义 ;有 了 样本 及 后 ( 即 收看 成 一 个 已 知 数 ), 把 和 看 成 一 个 随机 变 
量 , 而 (4.27) 给 出 了 人 的 分 市 ,这 分 布 称 为 0. 的 信任 分 布 . 

为 什么 可 以 把 9 看 成 随机 变量 呢 ? 按 Fisher 的 意思 在 进行 
抽样 得 到 样本 于 之 前 ，6 是 一 个 未 知 数 . 我们 对 它 甘 然 无 bi 知 ， 
就 我 们 对 它 的 了 解 而 言 , 它 什么 值 都 可 以 取 , 取 什 么 值 可 能 性 有 多 
大 ， 一 点 也 说 不 上 ， 但 在 抽样 得 到 及 后 , 虽然 这 时 9 仍 有 可 能 取 
种 种 值 ,但 对 取 这 些 值 的 可 能 性 如 何 , 通过 样本 了 提供 的 信息 ,我 


们 就 有 些 知识 了 .例如 ,考虑 到 4 是 于 的 均值 ,我 们 会 觉得 , 9 落 . 


在 马 附近 的 可 能 性 , 较 远离 了 的 可 能 性 大 (读者 可 以 把 这 个 说 法 
与 “ 似 然 性 ”的 概念 联系 起 来 考察 )。 这 只 是 一 个 笼统 的 、 非 定量 的 
说 法 ,而 (4.27) 则 对 0 取 各 种 值 的 可 能 性 给 予定 量 的 刻 划 ( 在 得 到 
的 背景 下 ). 

因此 ,在 这 种 看 法 之 下 , 样本 互 的 作用 ,或 更 确切 地 说 ,样本 
芝 所 提供 的 信息 ， 就 表现 在 它 破除 了 我 们 对 9 的 完全 无 知 , 而 以 
一 个 概率 分 布 的 形式 总 结 了 对 9 的 新 认识 (有 了 节 以 后 的 认识 ). 

这 种 看 法 可 以 立即 用 于 有 关 8 的 统计 众 断 问题 。 例如 要 作 0 
的 区 间 估 计 , 给 定 w 我 们 可 以 找 @.D， :一 使 Pl(a<0<5)=~1- 
al 训 表示 9 的 信任 分 布 )、 按 (4.27), 这 要 求 a.3 满足 

DX) -BFR-0)=1—a. (4.28) 

满足 (4.28) 的 a.5 很 多 ,可 以 取 一 组 4.5, 使 5 一 a 最 小 ， 这 时 4= 
及 一 ways, 5 一 下 十 Wara (读者 自 证 )， 这样, 我 们 得 到 9 的 一 个 区 
间 估 计 , 其 信任 系数 为 1 一 a, 此 区 间 估 计 即 [及 一 wwjs, 导 十 Wops]， 

现 车 从 入 (9，1) 中 抽出 多 于 1 个 独立 随机 样本 及 1，…， 玉 ，， 
怎样 去 决定 由 这 些 样本 提供 的 信任 分 布 ? Fisher 的 作法 (很 自然 
地 ) 是 注意 到 部 是 9 的 充分 统计 量 , 且 Mn (于 -0)~N(0, 1)， 
利用 这 一 点 ， 像 前 面 %w~1 的 情况 一 样 , 得 到 8 的 信任 分 布 是 0~ 
(及 ,1/w)， 由 此 出 发 ,可 建立 9 的 信任 系数 为 1 一 a 的 信任 区 间 
[总 ~- Ua/a/ Vn, 不 十 Waray/ Vn] 。 

又 如 ， 设 及， …， 和 wka ac， a 和 o 都 是 未 知 参数 ， 以 
站 和 悦 分 别 记 样本 均值 和 样本 方差 , 则 有 Vn (于 --@)/S~4_y 
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以 和 ax(o 记 自由 度 为 m- 工 的 二 分布 函 数 , 有 卫 (wWVm (有 -a@)/8 
<2zZ) 一 ai(o)。 将 其 改写 为 P(e> 立 一 So/w wm) 一 io)， 就 
确定 & 的 信任 分 布 ， 利 用 它 , 可 得 到 e 的 信任 系数 为 1 一 a 的 信任 
区 间 , 即 (4.16). 

在 以 上 几 例 中 , 信任 分 布 的 求 得 基本 上 是 个 形式 上 的 转换 , 由 
之 所 决定 的 信任 区 间 ， 与 Neyman 理论 所 决定 的 置信 区 间 也 完全 
一 样 ， 因 此 , 在 Fisher 方法 发 表 的 初期 ， 人们 认为 它 与 Neyman 
的 方法 , 是 同一 件 事 的 两 种 不 同 的 说 法 ， 然 而 , 往 后 的 发 展 使 人 清 
楚 地 看 到 , 这 二 者 是 不 同 的 , 不 仅 方法 的 解释 上 不 同 , 具体 结果 也 
不 同 ， 这 一 点 在 下 面 要 讲 的 Behrens-Fisher 问题 中 可 以 看 出 来 

”在 Neyman 理论 中 ，9 是 一 个 虽然 未 知 ， 但 是 为 非 随机 的 党 
数 ,， 它 谈 不 上 有 什么 分 布 。 这 个 理论 不 需要 在 传统 的 概率 论 之 外 
引进 什么 新 概念 ， 它 在 解 问题 ( 求 具体 参数 的 区 间 估 计 ) 时 所 涉及 

的 计算 和 推理 , 都 是 在 传统 的 概率 论 中 早已 确立 的 框框 之 内 . 

Fisher 的 信任 推断 理论 则 不 然 , 它 虽 则 也 要 借用 传统 概率 论 
的 结果 ,但 有 两 个 根本 问题 

工 .信任 分 布 究竟 是 什么 .在 基于 频率 解释 的 概率 论 中 ,分 布 
的 概念 基于 概率 ， 而 概率 有 一 种 可 诉 诸 实验 验证 的 频率 解释 ， 在 
Fisher 理 论 中 ,信任 分 布 理解 为 人 们 对 9 取 各 种 值 的 信任 程度 的 刻 
划 ， 但 这 “信任 程度 ”， 一 般 讲 可 以 因 人 而 党 ， 且 无 法 诉 诸 实 验 验 
证 . 

这 个 困难 还 不 是 很 实质 性 的 . 因为 , 我 们 可 以 用 一 种 类 似 于 
“公理 化 ”的 作法 , 对 “信任 分 布 ” 一 词 作为 一 个 不 加 说 明 的 基本 概 
念 , 犹如 几何 公理 中 的 一 个 点 .比方 说 , 可 以 这 样 定义 信任 分 布 ， 
它 是 一 个 由 样本 具体 值 和 样本 分 布 族 所 决定 的 一 个 函数 ， 具 有 非 
降 、 左 连续 等 等 性 质 ， 这 当然 无 所 不 可 ,但 这 样 一 来 就 必须 解决 下 
面 的 问题 . ， 

2. 怎样 确定 信任 分 布 ” 即 , 要 制定 一 些 合理 的 规则 , 使 用 这 
些 规则 , 就 可 以 在 已 知 样 本 具体 值 及 祥 本 分 布 时 , 唯一 地 定 册 参数 
的 信任 分 布 ， 
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这 个 问题 至 今 未 获 解 决 。 Fisher 在 充分 统计 量 存在 时 , 指出 
了 如 何 决定 信任 分 布 , 如 我 们 前 面 讨论 过 的 几 个 例子 . 但 是 , 充分 
统计 景 不 是 经 常 存在 . 退 一 步 说 , 即使 存在 ，Fisher 也 没有 指出 
一 种 普遍 的 方法 ,足以 唯一 地 决定 信任 分 布 ， 如 在 肝 1,…, 斑 , 必 
Nga, ca?) 的 例 中 , 由 wm (总 一 oa)/S~ ti 出 发 决定 了 “的 一 个 信 
任 分 布 . 但 是 ,能 否 由 别 的 充分 统计 量 出 发 得 到 另外 的 信任 分 布 ? 
即使 限于 从 ( 互 ，S2?) 出 发 ,能 否 得 出 另外 的 信任 分 布 也 不 明确 . 

”由 于 这 些 原因 ，Fisher 的 思想 在 统计 学 界 引 起 了 相当 的 兴趣 
和 争论 。 大 约 有 这 样 几 种 看 法 . 有 的 学 者 ， 如 Neyman, 对 此 是 持 
完全 否定 的 态度 的 . 有 的 人 承认 这 理论 不 完善 , 但 认为 不 妨 探索 
一 下 , 这 些 问 题 可 否 解决 ,或 在 一 定 范围 内 解决 (例如 Fraser). 另 
一 种 持 实用 观点 的 人 则 认为 ,不 管 其 基础 如 何 , 它 在 某 些 问题 中 所 
供 了 可 用 的 解法 ,在 这 种 情况 下 , 不 必 因 其 基础 问题 未 解决 而 拒绝 
不 用 . . 


(二 ) 用 Fisher 方法 解 Behrens-Fisher 问题 

前 已 指出 , Behrens-Fisher 问题 是 这 样 一 个 问题 ; 设 全 1,…， 
和 nm 人 (oa ai 了， …， 了 一 人 (5 08), 4.5.01.05 都 是 未 知 参 
数 , 且 合 样本 了 1，…， 瑟 ww 了 1，…, 了, 独立。 要 找 5 一 o 的 区 间 
信 计 (或 者 ,要 检验 假设 4 二 了 ， 一 旦 解决 了 5 一 a 的 区 间 估 计 间 题 ， 
就 可 得 到 此 假设 的 一 个 检验 法 , 即 , 当 区 间 估 计 不 包含 0 时 否定 
一 20。 因此 ,下 面 不 另 讨 论 这 个 问题 ). 

这 个 问题 在 实用 上 有 很 重要 的 意义 。 因为 在 许多 情况 下 , 两 
总 体 方差 相等 的 假定 未 必 成 立 。 有 不 少 学 者 在 Neyman 理论 的 
范围 内 提出 了 一 些 解法 ,它们 在 这 个 意义 下 是 不 精确 的 . 即 其 置信 
系数 只 是 近似 而 非 精 确 地 等 于 指定 的 工 -a。1943 年 Scheffe 提 出 
过 一 种 解法 ， 它 在 上 述 意义 下 是 精确 的 (置信 系数 葡 为 1-o。 可 
是 这 个 解法 有 一 个 很 大 的 缺点 : 其 解 依赖 于 样本 排列 的 次 序 ,而 无 
论 从 那个 角度 看 都 不 应 有 这 种 依赖 性 。 有 的 学 者 , 如 Linnik, 对 
此 问题 进行 了 很 深刻 的 理论 研究 
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现在 来 叙述 Fisher 基于 信任 分 布 的 解法 ， 分别 以 互 .8 了、 
姐 记 于 样本 和 了 样本 的 样本 均值 和 样本 方差 , 以 太刀 记 两 个 独 
立 随机 变量 ， 其 分 布 分 别 是 自由 度 为 m1 和 mn 一 的 t 分 布 ， 又 
以 & 一 一 记 随 机 变量 & 和 改 有 相同 分 布 则 有 
Vm(F -a)/S: < ti, Vn(F—b)/Ss 2 加 。 
(4.29) 
记 2 一 了 一 对 ,6 一 bg，、 又 Si=SJ/Mm，S=Ss/Mn。 则 由 
(4.29) 得 


ZS—0= S83ta— Bit, b=2Z— (Sts— SI1t1). (4.80) 
有 了 样本 以 后 , 2、St.S3 可 算出 具体 值 。 为 醒目 起 见 ,分 别 把 它们 
记 为 z, sa 和 8 记 住 它们 都 是 已 知 的 常数 , 《4.30) 式 给 出 0 的 
信任 分 布 , 即 : 

6 的 信任 分 布 (在 已 有 样本 , 且 算 出 Z=z, Si 一 8%, i 一 1,2 时 ) 
一 z 一 《sta 一 81 左 ) 的 通常 分 布 ， (4.31) 
因为 二 , fa 独立 且 各 有 t 分 布 , 《4.31) 右 边 不 难 算出 。 这 样 就 确定 
了 0 的 信任 分 布 ， 由 此 可 以 对 它 作出 区 间 估 计 。 了 isher 把 它 用 下 
面 的 方式 表 出 来 , 以 便于 造 表 ; 记 = V 琵 寺 呈 。 并 找 山 使 cosy 
一 s2/Tr， 这 时 gin 由 一 有 /7, 而 (Sito 一 8) 一 "(ta cos 由 一 机 sin 沙 )， 显 
然 , 妇 cos 峭 一 页 sin 由 的 (通常 ) 分 布 函数 只 依赖 于 mm 中. 以 Pnny， 
记 这 一 分 布 函数 , 找 ywwa>0, 使 

Fmnny Ym nw) — Fm,n,v — Ymn vra) -1—a, 
则 (如 前 ,了 记 信 任 概率 ) | 
P|z—0| <ryn,n,y,a) 
= P{ |tocosp — tsing | <Yymnv,a) ™ 1—o, 
即 PB(2g—ryn.nya 人 +rymny,e) ~1 一 a。 因 此 ,区 间 
2— ym ya + TYmn yal (4.32) 
是 0638 一 a 的 信任 系数 为 1 一 a 的 信任 区 间 . 注意 在 有 了 样本 并 
给 定 w 后 ，%、7、gminwwau 都 可 以 定 出 。Fisher 和 Yates 曾 给 出 
yn,wwa 的 表 。 
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Neyman 曾 对 这 个 解法 提出 批评 .一 点 是 有 关 “ 信 任 分 布 本 
身 及 本 例 中 导出 信任 分 布 的 过 程 这 方面 的 ,由 于 Neyman 和 
Fisher 的 立 脚 点 不 同 , 这 一 点 可 以 姑 置 细 论 ， 另 一 点 是 Neyman 
通过 计算 证 明 , 若 把 .4.32) 视 为 一 个 置信 区 间 ?, 则 其 置信 系数 (而 
不 是 信任 系数 ! ) 并 非 1 一 a。Neyman 指出 : 区 间 (4.32) 包 含 被 估 
计 的 8 一 & 的 概率 (不 是 信任 概率 ! ); 依赖 于 比值 c=caa/ca. 他 就 
m==12, 9 一 6 和 oa 一 0.05 的 情 沈 ， 算 出 当 p 一 0.1, 1.0 和 10 时 ， 
这 概率 分 别 为 0.966, 0.960 和 0.934， 而 不 是 名 义 上 的 0.95. 
Neyman 的 这 个 批评 的 意义 ,在 于 明确 了 在 本 问题 中 “置信 系数 
和 “信任 系数 确 不 是 “ 涪 异 实 同 的 东西 .因而 Fisher 的 方法 与 
Neyman 的 方法 不 是 一 回 事 . 使 人 感 兴趣 的 是 ，Neyman 算出 的 
值 与 0.95 相去 不 远 ， 因 此 觉得 , Fisher 提供 的 解 是 可 以 放心 使 用 
的 ， 


$4.3 ”容忍 区 间 与 容忍 限 


本 节 要 讨论 的 问题 , 其 提 法 与 区 间 估 计 问 题 并 无 共同 之 处 ,但 
其 解 有 形式 上 的 相似 性 -一 -都 是 用 一 个 由 样本 确定 的 区 间或 上 、 
下 和 限 的 形式 表达 . 因此 我 们 把 它 附 在 这 一 章 的 末尾 ,， 作 一 个 很 简 
单 的 介绍 . 


(一 ) 问题 提 法 , 容忍 区 间 与 容 思 限 的 定义 
设 某 工厂 生产 一 种 产品 ， 其 质量 指标 下 服从 正 态 分 布 N(a,， 
5]， 暂 假定 ac 和 都 已 知 ， 给 定 B, 0<B<1(8 通常 很 小 ) .以 
(wg, 0) 记 入 (a, cs) 的 分 布 函数 ,可 以 找到 许多 实数 01 一 5, 使 
F(bs;w, 0)—F(bsa, o)>1— Bp. (4.88) 
比方 说 ， 玉 一 6 一 cue Ds 一 4 十 cuss 就 是 这 样 的 一 对 实数 ， 另 

外 ,也 可 以 定 出 5s 入 ,分 别 满足 以 下 的 不 等 式 
1) 读者 谅 必 注意 到 ,置信 区 间 和 信任 区 闻 在 外 形 上 并 无 区 别 , 它们 都 是 一 个 依赖 

于 ( 且 只 依赖 于 ) 样本 的 区 间 。 不 同 之 处 在 于 得 出 的 过 程 及 意义 的 解释 。 
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1(0 0) 和 8 000 0 o>1—B. (4.34) 
比方 说 ,可取 
ba— a ousg, 04=a-t ousg. 

如 时 一 对 实数 0, ba 满足 (4.38)， 则 在 该 工厂 生 产 的 产 总 中 ， 
至 少 有 100(1 一 8B)%, 其 质量 指标 落 在 51, 5s 之 间 ， 同 样 ,车 5s, 5 
满足 (4.84), 则 产品 中 至 少 有 100(1 一 8)%, 其 指标 不 小 于 加, 也 
有 100(1-- 8B) 狗 ,其 指标 不 大 于 如。 这 类 知识 可 能 有 重大 的 实际 
意义 。 比 方 说 , 车 指标 愈 大 产品 质量 愈 好 , 且 甲 等 品 要 求 指标 值 不 
小 于 指定 的 数 了 B， 给 定 8 一 0.01, 求 出 568， 著 5s 之 B, 则 表示 在 产 
品 中 至 少 有 99% 的 甲 级 品 ， 又 如 ， 指 定 了 两 个 数 Bl 过 Bs， 只 有 
当 指 标 值 落 在 B1、Bs 之 间 时 ,产品 才 合 格 。 指 定 8 一 0.01, 要 求 产 
品 的 合格 率 至 少 为 99%， 这 时 间 题 归结 为 ， 能 否 找 到 51、5。， 使 
(4.38) 成 立 , 且 Bi<o<po<B。 

如 时 6 和 确实 已 知 因而 并 的 分 布 已 知 , 这 里 就 不 存在 什么 
统计 问题 , 只 须 查 正 态 分 布 表 算 一 下 就 行 ， 如果 @.o 未 知 , 则 满足 
(4.38) 和 (4.34) 的 51,，5s，bs, b4 需 要 由 节 的 观察 值 去 估计 (比方 
说 ， pps 可 以 考虑 用 蕊 二 Suo， /9 去 估计 ， 及 2 为 为 样本 方差 ) 设 想 用 
某 个 估计 量 六 (了 ，…， 瑟 。) 一 和 去 估计 %。 这 时 产生 一 个 问题 : 
F(bs; co, 0) 一 (bi; a, o) 是 否 能 >>1-- By 由 于 访 ，2 有 随机 性 ,我 
们 显然 不 能 绝对 保证 这 一 点 ， 于 是 就 只 好 降低 要 求 : 给 定 7，0< 
y<1(7 通常 很 小 ), 要求“F(bo; 4, 0) 一 了 (bs; 4, 0) 之 1 一 B” 这 个 
关系 至 少 以 概率 1 一 7 成立, 对 如, 2 也 可 提出 类 似 的 要 求 . 这 就 
引导 到 容忍 区 间 和 容忍 限 的 概念 以 上 我 们 假定 变量 互 的 分 布 
是 正 态 ， 这 一 点 当然 不 是 本 质 的 ， 对 别 的 分 布 也 可 提出 同样 的 问 
题 . 

因此 ， 现 设 变量 筷 有 分 布 了 (2) 分布 已 完全 未 知 ， 或 者 其 
形状 已 知 但 有 些 参数 未 知 ， 五 1, ，…, 及 ,是 有 的 独立 随机 样本。 
设 给 定 了 6, 7, 0 一 8 一 1 0<7<1， 又 设 T=T 了 (下 1,*…*， 斑 ,)， 
i 一 1.2、3.4, 都 是 统计 量 , 满 足 条 件 Ti<2s. 

定义 &.& 称 [T1, To]j 为 琅 的 一 个 (B6， 7) 容 愉 区 间 , 车 
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PyCFOTs)— FT)>1—B)>1-Y (4.35) 
称 Ts.74 分别 是 五 的 (B, YY) 容 忍 下 、 上 限 ,车 
~ Pr(1- F(Ts >1-pB)= Pr( F(Ts)<B)>1-Y, (4.36) 
Prp(F(T,)>1—B)>1—Yy. (4.37) 
此 处 Pr 表示 : 在 计算 事件 {F(To( 昼 ,， 机 玉 。)) 一 五 (Ti 下 “> 
节 ,)) 产 1 一 B} 等 的 概率 时 ,下 1,…， 于 ,各 有 分 布 五 . 
我 们 注意 到 , 从 形式 上 看 ,容忍 区 间 和 容忍 限 与 置信 区 和 间 和 置 
信 限 有 相似 之 处 ,但 实质 上 是 不 同 的 东西 . 主要 在 于 : 后 者 的 目的 
是 佑 计 分 布 中 的 未 知 参 数 , 而 前 者 则 并 非 如 此 . 拿 容忍 区 间 来 说 ， 
”因为 满足 条 件 了 (6s) 一 F(B1) 之 1 一 B 的 实数 对 有 无 穷 多 ， 因 此 不 
能 说 TTs 是 为 估计 b、5s， 有 即使 退 一 步 说 ,我 们 用 某 种 方法 选择 
一 组 确定 的 01、 bs 《如 正太 分 布 中 的 01， 5 一 5 士 oue/a)， 我 们 仍 不 
能 说 Ti、 Ts 是 为 估计 51,5。， 因为 在 容忍 区 间 的 定义 中 , 我 们 并 
不 关心 2 Ts 是 否 与 h1、Bbs 接近 , 而 是 关心 (Ts) 一 了 (TI) 是 否 
兰 1 一 6 这 当然 不 是 一 回 事 . : l 
话 虽 如 此 说 ,这 二 者 之 间 还 是 存在 一 定 的 联系 . 例如 , 仿照 定 
义 4.23, 可 定义 (Q, 7)U 了 MA 容忍 限 , 是 可 以 证 明 , UMA 置信 界 和 
UMA 容忍 限 之 间 有 一 定 的 联系 。 有 关 细 节 这 里 都 不 谈 了 ， 我 们 
只 就 几 种 情况 来 讨论 一 下 求 容 忍 区 间 和 容忍 限 的 方法 . 


(二 》 苦 的 分 布 函数 下 (w) 完 全 未 知 ， 但 假定 它 在 (一 co，co ) 
处 处 连续 

这 是 一 个 典型 的 非 参数 统计 问题 .其 解法 是 次 序 统计 量 的 一 
项 应 用 。 先 证 明 一 个 预备 事实 ， 

引 理 4.1 设 一 维 变量 闷 ~ 克 (oz) 且 万 (四 处 处 连续 ， 则 了 一 
F(X¥)~R(O, 1). 

证 因为 0< 了 <1， 上 只 须 对 0<y<i 证 明 P(Y <y)=y,， 记 
t=inf{z: 了 F(z) 这 y}, 则 由 玉 (w) 处 处 连续 且 非 降 , 易 见 F(t) =y， 
以 及 了 (vw) <ye9v<t。 故 

PAY <y)=P(F(X)<Y)= P(E<O= EG) =Yy, 
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现 设 了 1,…, 了 ,为 于 的 独立 观察 值 ， 革 <… 志 芷 0w) 为 其 
次 序 统 计量 .根据 引 理 4.1 知 ,车 记 Ui 一 了 (及 站, 6 一 4，…, mn, 则 
Us, …, U,~BR(0, 1)， 因 此 , 车 以 Uw<…<<Uo 记 Ui pp U， 
的 次 序 统 计量 ， 则 Uw= F(X), = 二 on。 记 Vy=Uwn -Uw, 
1<4< 和 Km， 的 密度 已 在 出 .27) 式 给 出 , 有 

P(F(Xw#H)— F(X)>1-B)=PYy>1—B) 

-| wu 人 oa (4.38) 
其 中 go 由 (+.27) 式 给 出 。 如 果 选 择 公 六 使 (4.38) 式 中 的 积分 不 
小 于 给 定 的 1 一 7, 则 根据 定义 , [了 oo, 了 及] 就 是 也 的 一 个 (B86, 7) 
容忍 区 间 . 一 般 , 尽 可 能 选择 4 六 使 i 十 j 一 nn 十 1, 或 mn, mn 十 2 也 可 
以 、 这 样 得 出 的 区 间 一 般 较 短 些 . 阁 对 某 个 mn， 即使 取 % 一 1 和 
j 一 %,《 和 4.38) 的 积分 也 比 1 一 7 小 ， 则 这 个 方法 行 不 通 . 这 时 ,或 者 
降低 1 一 或 1 一 y 之 值 ,或 增 大 %n. 

一 个 分 布 若 有 形 如 代 .27) 的 密度 ,就 称 为 Beta 分 布 ,参数 为 
?一 和 呈 一 证 二 记 为 Be( j 一 和 mn 一 十 +1)，Beta 分 布 的 参 
数 不 必 为 整数 , 只 要 大 于 0 就 行 . 当 2>0 9>0 时 , Be(p, 9) 表 示 
一 分 布 ,分 布 函 数 为 


了 po(8) 一 Fr #1(1 tat. (4.39) 
BCp, 9) ~ v1(1 一 人 Gt, 称 为 Beta 积分 ， 热 知 它 与 Gamma 


函数 工 (z) 有 关系 ; BC(p, 9)=T 了 (Pp)T(gq)/T(pt+g). (4.39) 当 
0< "< 时 称 为 不 完全 Beta 积分 ,Pearson 曾 给 它 造 了 表 . 这 表 
可 用 于 选择 六 了 的 问题 . 
五 的 容忍 上 下 限 的 问题 也 同样 处 理 。 有 
P(F(Xw)>1-B)=P(Uw>1-B), 
利用 (1.25) 式 ,在 其 中 置 了 (2z) 一 四 f(w) 一 1, 得 


P(F(Rw) >1-B)=) goesreaCo)ao， (4.40) 
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PCPCTo)< 有 -| gn (4.41) 


选择 名 使 (4.40) 和 (4.41) 的 有 边 的 积分 记 1-7， 则 闷 o 是 了 了 
”的 (B, 7) 容 为 上 限 , 而 Yo 是 了 的 (B, 7) 容忍 下 限 , 它们 可 借助 
于 不 完全 Beta 函数 表 求 得 . 


(三 ) 正 态 分 布 的 容忍 区 间 与 容 汶 限 

实用 上 有 重要 意义 的 是 找 正 态 分 布 的 容忍 区 间 与 容忍 限 ， 这 
个 问题 在 本 节 一 开始 就 提出 来 了 . 

因为 正 态 分 布 函 数 处 处 连续 , 所 以 上 一 段 的 解法 适用 于 它 .但 
是 这 一 解法 没有 利用 正 态 分 布 的 特点 , 因此 结果 比较 粗糙 。 这 里 
我 们 用 苦于 充分 统计 量 ( 祥 ，5”) 的 解 ， 它 在 直观 上 更 容易 理解 . 

设 有 样本 1,…, 及 ,~.NCg, cx 和 = 都 未 知 . 在 本 节 
开始 处 已 指出 , 车 &.o 已 知 ， 则 (8, 7) 容忍 上 下 限 和 容忍 区 间 分 
曾 为 a ous.a — aus {eg ~ owWgy, GZ 十 C26/g] . 现 go 未 知 , 可 分 
别 用 于 和 去 估计 它 。 由 于 估计 而 带 来 的 随机 性 , (B, 7) 容 忍 上 
限 不 见得 正 是 瑟 十 Suers, 而 可 能 要 将 系数 vera 修改 为 菜 个 入 入 既 
与 BB 有关 , 也 与 ?7 有关 ( 注 意 waa 与 y 无关 。 仅 由 这 一 点 就 可 知 
道 至 十 Susys 非 (B8, 7 容忍 上 限 )。 容忍 下 限 和 和 瞪 妨 区间 也 如 
此 . 

因此 , 我 们 来 找 X, 使 互 十 NS 为 (B, 7) 容 忍 上 限 , 以 Fo,s(2) 
记 六 (cc9) 的 分 布 函数 ， 为 要 了 ,ol 时 十 M5) 之 1-B， 充 要 条 件 
是 及 十 和 >a-i+ows， 于 是 问题 归结 为 求 和 ,使 

P(XF+%S>a+ous)>1—Y, 

记 S'=S/o, Mn( 下 ~a)/o~ 了 ,由 上 式 得 


P(E > nA)>1—7y. (4.42) 


1 ,PNW(C0, 1)， 故 由 非 中 心 8 


分 布 的 定义 ， 知 (Y 轩 VV Nn ue)/S ~ bs 09 一 一 VW Wg, 如 时 能 
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馈 确 定 》, 使 Pfb_dts 和 一 1 一 则 和 一 一 /wm 满足 (4.42)， 
而 人 6, 力 容 忍 上 限 为 立 十 NS， 由 正 态 分 布 的 对 称 性 ， 易 知 (B，7?) 
容忍 下 限 为 是 一 AS， 当 然 , 现 有 的 非 中 心 1 分 布 宕 规模 还 不 够 大 ， 
不 一 定 能 直接 从 天 上 查 出 入 . 

(B, 7) 容 忍 区 间 可 以 利用 上 面 求 得 的 容忍 上 ,下限 , 再 利用 下 
述 的 一 般 规 则 定 出 . 

引 理 4.2 若 1， 7 分 别 是 了 的 (8/3， Yi 2) 的 容忍 上 、 
下 限 ， 且 总 有 Ti 之 To, 则 [Ti3,， Tal 为 了 的 (B，7) 容 忍 区 
间 ， 

证 明 很 容易 ， 留 给 读者 作为 练习 。 但 用 这 种 方法 作出 的 
(8B, 7) 容忍 区 间 一 般 失 之 过 粗 ，Wald 和 Wolfowitz 提出 了 一 种 


近似 解法 如 下 : 以 C2) 记 和 (0, 1) 的 分 布 函 数 , 找 5, 使 6 
了 5)- 6 -5)- 1 一 B、 再 算出 和 = wm 一 ID A(7). 则 


[ 怀 一 183, 及 十 A5] 近 似 地 为 了 的 (B, 7) 容忍 区 间 . 这 和 解法 的 一 
个 优点 是 计算 容易 些 , 且 入 有 表 可 查 . 


习 题 

1. 设 1, Rn~N(a, o7), Yi,'"r, Yn~N (00g, 90%), oc.01,03 已 知 ,a 
未 知 ,c 天 0。 又 合 样本 有 1， …， 苹 mm， 了 1，…， 了 独立 。(3) 找 a 的 UMVUE. 
(基于 此 UMV UE, 构造 a 的 一 个 置信 系数 为 1 一 a 的 置信 区 间 ( 提 示 : 决定 
常数 a， 使 4 对 十 (1 一 QD)Y 了 /fe 的 方差 最 小 证 明 这 是 a 的 无 偏 估 计生 达到 
一 已 不 等 式 的 下 界 ). 

2， 设 全 ， 世人， 00)， 一 ce 天 站 一 0 天 co 0 0 都 未 知 ，(a) 
找 出 8 一 在 的 一 个 置信 系数 为 本 -上 的 置信 区 间 ( 提 示 : 证 明 [(9 一 人) 一 
Gnax 和 -min 和 DO]/(0 一 的 的 分 布 与 bu 9 无关).(b 找 出 (9+6)/3 的 


1e tan 
置信 系数 为 -ca 的 置信 区 闻 ( 提 示 : 证 明 
《max ,十 min 上 (O01 + 02))/ Cmax Xmin 的 


Ts ti 
的 分 布 与 Qt，9s 无 关 ， 为 此 不 失 普 凯 性 可 设 6 一 0)， 
8， 设 人 1 于， nn~RO, 0), Yi 1, Yi~ BRO, 0,), 机 >0, 66 二 0 部 
来 知 , 甩 合 样本 独立 。 找 出 04/0s 的 一 个 置信 系数 为 1 一 a 的 置信 区 间 ( 提 示 ; 


。 J89 。 


em, 


邻 T==max XTs=maxY 了 l， 证 明了 2 入 的 分 布 与 9、9s 都 无 关 )， 
1eicm 1<i<n T1 0, 
4、 具 有 密度 


90a—1 
bs 化 ) 3 eei0 0 >0, 


flr, gu 09 =-{ 


了 


7<0 
的 分 布 称 为 到 eibull 分 布 , 9> 0, g>0 都 是 未 知 参 数 ， 设 1 …p” 总 。 汶 
抽身 具 此 分 布 的 总 体 的 独立 随机 样本 .(a) 写 出 为 估计 9 包 的 似 然 方程 。 
(b) 今 了 ,= (和 /0 1 一 1 2 证 明 Yi …， 了 。 独立 同 分 布 , 且 Za 的 分 
布 与 93 无 关 ，(e) 将 似 然 方程 转化 到 Z4，…， 了 Zn， 以 证 明 若 筷 为 似 然 方 
程 对 6; 之 解 , 则 久 /63 的 分 布 与 tba 都 无 关 ，(d) 指出 利用 (e) 中 之 结果 去 
构造 9 的 置信 区 间 的 方法 (此 方法 有 表 可 查 ). 
5， 设 XX1，…， ,为 从 具 密 度 
ET)， ~ 0 


fz, 0) -to vO 
的 总 体 中 抽出 的 独立 随机 样本 , 一 <9< oo, 6 未知 ,证 明 ，min 和 ,一 9 的 分 
布 与 6 无 关 ， 求 出 此 分 布 ， 从 而 确定 6 的 置信 系数 为 1~.w 的 置信 区 间 ( 提 
示 : 记 久 = 了 ,一 9, i=1，…, nn， 证 明 了 4, …， 了 的 分 布 与 9 无关 , 又 注意 
min X,— 0mmin X). z 

6. 设 荆 ~BCm, D1), 了 ~BCn, pa)，m.n 很 大 ,ps 是 未 知 参 数 . 作 
出 基于 和 .了 的 、p9 一 pt 的 置信 区 间 , 渐 近 置信 系数 为 1 一 a 

9. 设 Ka …，Xw 和 五 ,…， 了 Ys 分 别 为 自 具 参 数组 和 9 的 Cauchy 分 
布 总 体 中 抽出 的 独立 随机 样本 (参数 为 9 的 Cauehy 分 布 有 密度 {x[1 十 (2 一 
9)”]}“), 合 样本 独立 且 m%、% 很 大 ， 作 多 0: 的 置信 区 间 , 渐 近 置信 系数 为 
1-~ a( 提 示 : 利用 样本 中 位 数 及 其 极限 定理 》. 

8， 设 X1，…，X。 和 了 1,…,， 了， 分 别 是 从 具 参 数 及 和 和 hn 的 指数 分 布 
中 抽出 的 独立 随机 样本 (参数 为 的 指数 分 布 有 密度 h%-* 当 w>0 (z<0 时 
为 0)), 合 样本 独立 试 确定 加 一 入 的 一 个 信任 系数 为 1-a 的 信任 区 间 ( 不 
必 算 到 底 , 指出 方法 就 可 以 。 提 示 : 利用 和 Nm 对 ~ 太 mhgn 了 ~xn)，- 

9、 设 Xi …，XXm 和 了 了 1,”…，Y。 分 别 是 从 两 个 总 体 中 抽出 的 独立 随机 
样本 , 且 合 样本 独立 ， 仿 上 题 的 方法 求 : (a) 第 一 、 二 总 体 的 分 布 分 别 为 N (a,， 
oo) 入 (Db, o3)， 4.6.03.03 都 未 知 , 求 3 一 03 的 信任 系数 为 1-a 的 信任 区 
闻 ，《b) 第 一 、 二 总 体 的 分 布 分 别 是 RC0, 9;) 和 RC0, 0s), 01>0，0s>0 未 
知 , 求 0 一生 的 信任 系数 为 -a 的 信任 区 间 . 

10. 设 Xi …，X。 潮 自 指数 分 布 L.8) 中 抽出 的 独立 随机 样本 ， 定 出 


于 90， 


和 的 信任 分 布 , 由 之 定 出 其 信任 系数 为 1- cx 的 最 短信 任 区 间 ( 提 示 : 用 充分 


统计 量 X). 
11. 设 样本 与 总 体 分 布 同 上 题 ， 试 定 出 形 如 0/ 和 的 (8, 7) 容 忍 上 下 限 ， 


并 利用 引 理 4.2, 定 出 (B, ?7 容忍 区 间 ， 
12. 设 Xl Zn~ RO, , 9>0 未 知 . 试 利用 统计 量 max 又 和 定 出 


《8， 7) 置 信 上 、 下 限 . 
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第 五 章 ”Bavyes 统计 与 统计 判决 理论 


学 过 初步 概率 论 的 人 都 知道 Bayes 公式 . 此 公式 包含 在 次 国 
学 者 了 .Bayes 于 1768 年 (在 他 去 世 后 两 年 ) 发 表 的 一 篇 文章 中 .从 
形式 上 看 , 它 不 过 是 条 件 概率 定义 的 一 个 简单 推论 ,但 却 包含 了 归 
纳 推理 的 一 种 思想 , 这 一 点 在 Bayes 文章 题目 中 已 点 明了 。 后 世 
的 学 者 把 它 发 展 为 一 种 关于 统计 推断 的 系统 的 理论 和 方法 ， 通称 
Bayes 统计 ， 信奉 Bayes 统计 ， 乃 至 鼓吹 Bayes 观点 是 关于 统计 
推断 的 唯一 正确 观点 的 那些 统计 学者， 组 成 数理 统计 学 中 的 
Bayes 学 派 . 

在 本 世纪 二 ,三 十 年 代 ， 就 有 一 些 学 者 ， 例 如 Jeffreys, 
Keynes， 鼓 歇 Bayes 学 派 的 观点 ， 但 Bayss 学 派 取得 较 大 的 影 
嘱 , 还 要 算 到 战 后 特别 是 六 十 年 代 以 来 的 事情 ，, 时 至 今日 ,每 个 学 
习 数 理 统计 学 的 人 , 都 应 当 对 这 个 学 派 的 观点 和 方法 有 所 了 解 .对 
主要 兴趣 在 于 应 用 者 也 不 能 例外 . 

Bayes 学 派 的 观点 在 统计 学 界 引起 了 热烈 的 争论 . 在 介绍 
。 Bayes 统计 的 基本 内 容 时 ， 不 能 也 不 应 回避 这 些 问题 . 有 一 点 需 
要 说 明 的 是 : 虽然 本 书 在 讨论 这 种 问题 时 , 难免 要 渗 杂 作者 自己 的 
一 些 看 法 ， 但 我 们 将 力求 做 到 从 不 偏 不 倚 的 立场 去 介绍 争论 中 的 
种 种 观点 ,希望 使 读者 正确 地 理解 问题 实质 之 所 在 , 以 形成 自己 的 
统计 关 决 理论 是 A，Wald 在 1950 年 的 著作 <Statistioal 
Decision Funotion> 中 提出 的 一 种 统计 理论 ， 这 个 理论 对 战 后 时 
期 数理 统计 学 的 发 展 起 了 较 大 的 影响 ,可 以 认为 ,现在 它 已 成 了 数 
理 统计 基础 结构 中 的 一 个 组 成 部 分 , 在 应 用 上 也 有 其 重要 性 。 它 
与 Bayes 统计 并 无 逻辑 上 的 包含 或 承前启后 性 质 的 关系 . 二 者 
的 联系 , 一 方面 在 于 Bayes 判决 是 统计 淹 决 中 的 一 个 重要 部 分 , 
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一 方面 在 于 Bayes 方法 在 整个 统计 判决 理论 中 是 一 个 重要 工具 。 
因此 我 们 把 这 两 个 主题 放 在 这 同一 章 中 来 讨论 . 

在 本 章 中 , 我 们 不 可 能 对 这 两 个 主题 作 详细 的 阐述 . 我 们 的 时 
的 ,除了 介绍 一 些 有 用 的 方法 以 外 , 尤其 重要 的 是 , 希望 读者 能 对 
所 论 问题 有 一 个 虽然 只 是 初步 .但 还 是 清楚 而 比较 系统 的 了 解 . 没 
有 这 一 点 了 解 ,就 谈 不 上 对 现代 数理 统计 学 有 一 个 较 全 面 的 认识 。 


85.1 Bayes 统 计 推 上 断 


(一 ) 从 Bayes 公式 谈 起 
”前面 提 到 , Bayes 统计 的 基本 观点 是 由 Bayes 公式 引 伟 而 来 . 
我 们 知道 Bayes 公式 ,也 了 解 什么 是 统计 推断 ,因此 我 们 有 条 件 考 
察 一 下 , 这 Bayes 公式 是 怎样 与 统计 推断 挂 上 钧 的 . 
现 设 有 金 银 铀 三 种 合子 ,其 中 金 合 5 个 , 银 合 4 个 , 铜 合 三 个 。， 
每 个 合子 里 放 了 红 黄 蓝 白 四 种 球 ,个 数 为 . 金 合 : 红 70, 鞭 20, 蓝 . 
8, 白 2 银 合 : 红 10, 黄 75, 蓝 8, 白 12; 铜 合 . 红 5, 黄 12, 蓝 80, 白 . 


5 在 这 二 个 合 于 中 随机 抽取 一 个 (每 个 被 折 到 的 禄 率 为 也 )， 
再 从 这 合子 里 随机 抽取 一 个 球 (每 个 被 抽 到 的 概率 为 了) 发现 


结果 是 红 的 . 问 :“ 此 球 是 从 一 金 合 中 抽出 ”这 事件 的 概率 是 多 少 ? 
者 把 这 概率 记 为 | 红 ), 则 Bayes 公式 给 出 


_ 5 .70 /5 70 
P( 金 | 红 ) 癌 : -100 (sm 


4 10 3 5 )- 
ta'1001 70°10) 0/8. 


各 种 可 能 情况 计算 结果 如 下 ， 
了 P( 金 | 红 ) 一 70/81， 卫 ( 银 | 红 ) 一 8/81， P( 铜 | 红 ) 一 8/81， 
了 ( 金 | 黄 ) 一 25/109, 卫 ( 银 | 黄 ) 一 75/109, 卫 ( 铜 | 黄 ) 一 9/109， 
了 (人 金 | 蓝 ) 一 10/738， 了 ( 银 | 蓝 ) 一 3/73， 卫 ( 铜 | 蓝 ) 一 60/73， 
P( 爹 | 白 ) 一 10/55， 卫 ( 银 | 白 ) 一 86/55, 卫 ( 铜 | 白 ) 一 9755. 
(5.1) 
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从 概率 计算 上 看 这 是 一 道 最 普通 不 过 的 题 ， 可 是 我 们 可 以 改 用 一 
种 有 点 统计 气味 的 提 法 “要 由 抽出 的 球 的 颜色 ,去 推断 它 所 来 自 
的 合子 的 材料 ”. (5.1) 这 张 表 , 从 一 个 意义 上 说 , 给 出 了 推断 结果 ， 
因为 它 给 出 了 各 种 情况 可 能 性 的 大 小 ， 它 表示 我 们 知识 所 达到 的 
限度 。 如 果 一 定 要 给 出 一 个 判 然 的 回答 ,可 以 取 可 能 性 最 大 者 , 观 
表 5.1 知 应 为 . 

红 一 金 ; 黄 一 银 ; 蓝 一 铀 ; 白 一 银 . (5.2) 
(5.2) 是 一 个 完整 的 统计 推断 程序 , 它 告诉 我 们 ， 在 各 种 结果 之 下 
问题 该 如 何 回 答 . 

我 们 知道 ; 统计 推断 问题 是 有 了 样本 开 , 也 的 分 布 族 { 了 eC2)， 
956}, @ 为 参数 空间 ,要 由 且 去 推断 9， 上 面 这 个 例子 完全 可 纳 
入 这 个 模式 ， 为 此 引进 下 , 9. 

9( 金 ) 1, 0( 银 ) -2, 0( 铜 ) 一 3; 参数 空间 8@ 一 {1, 2, 3}. 

及 ( 红 ) 一 4, 妃 ( 黄 ) 一 2, 邓 ( 蓝 ) 一 3, 且 ( 白 ) 一 4 
样本 空间 . 2 一 {1, 2, 3, 身 . 

而 样本 分 布 族 为 : 

Fi(1) =70/100, Fi(2) ~20/100, Fj (3) ~8/100, Fi(4) =2/100; 
Fs(1)=10/ 100, Fa(2) =75/100, Fa(3) =3/100,F', (4) =12/100; 
Fs(1)=5/100, Fs(2) =12/100, Fi(83) =80/100, Fs(4) 一 37/100， 
统计 推断 问题 为 由 样本 及 ( 球 的 颜色 ) 推 断 9( 合 子 的 材料 )、 在 这 
个 提 法 之 下 ， 可 以 把 (5.2) 看 成 一 个 估计 量 6.6(D) =1, 6(2) = 
6(4) =2, 6(8) =8. 

但 是 ,我 们 应 注意 到 ,这 个 例子 的 情况 与 前 几 章 所 论 统计 推断 
问题 相 比 ,有 一 个 不 同 的 地 方 。 即 在 本 例 中 我 们 有 (5.1) 式 , 此 式 
是 从 一 些 假定 出 发 经 严密 推导 而 得 ， 并 不 依赖 任何 特殊 的 统计 推 
断 方法 ， 这 (5.1) 式 比 一 个 具体 的 推断 方法 一 一 例如 (5.2) 一 一 更 
为 基本 和 重要 ， 因为 它 告 诉 我 们 , 在 种 种 具体 的 样本 之 下 我 们 对 
参数 9 能 了 解 到 何 种 程度 , 它 不 取决 于 所 用 统计 推断 方法 。 相 反 ， 
由 它 可 以 产生 种 种 推断 方法 , 例如 (5.2)。 
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为 什么 在 前 儿 章 中 讨论 过 的 统计 推断 问题 中 ， 没 有 出 现象 
《5.1 这 种 性 质 的 结果 昵 ?这 是 因为 ， 在 此 例 中 被 推断 的 9 本 身 就 
是 一 随机 变量 (抽出 那 种 材料 的 合子 是 随机 的 ), 且 我 们 知道 了 48 
的 分 布 , 即 

了 (0 一 D -5/12, P(0= .2) =4/12, 了 (0 一 3) 一 3/12. 

(5.8) 
这 一 点 正 是 本 例 异 于 以 前 所 处 理 过 的 种 种 统计 推断 问题 的 决定 性 
因素 ， 也 是 Bayes 统计 区 别 于 前 儿 章 那 种 统计 的 特征 所 在 ， 下 面 


(二 ) 先 验 分 布 与 后 验 分 布 

设 样本 及 有 分 布 族 {Fe(z), 9E€6B}， 要 由 邓 推断 98， 这 里 ， 
模型 , 即 卫 的 分 布 族 , 提供 了 一 种 知识 . 这 个 知识 是 对 所 研究 的 
事物 的 知识 ,不 是 关于 和 & 的 知识 ,但 对 推断 0 有用， 男 一 种 知识 由 
样本 于 提供 , 它 包含 了 有 关 9 的 信息 。 在 前 几 章 , 为 推断 9, 就 依 
- 靠 这 两 种 知识 . Bayes 统计 与 此 不 同 之 处 ， 在 于 它 还 需要 另外 一 
个 前 提 ; 要 预先 给 出 9 取 各 种 可 能 值 的 概率 ， 形 式 上 说 , 它 要 求 把 
9 看 成 一 个 随机 变量 , 并 给 定 8 的 概率 分 布 互 (人 ， 由 于 这 个 分 布 
(8) 是 在 抽样 (观察 互 ) 以 前 就 给 出 来 了 ， 故 把 它 称 为 和 的 先 验 
分 布 ， 所谓“ 先 验 ”, 只 不 过 是 指 在 抽样 之 先 , 并 无 其 他 含义 . 

定义 5.1 参数 空间 侣 上 的 任 一 概率 分 布 , 叫 9 的 先 验 分 布 ， 

在 有 些 情况 下 ，0 的 先 验 分 布 存 在 是 一 个 合理 的 假定 . (一 ) 
中 那个 例子 就 是 如 此 , 且 先 验 分 布 即 为 (5.8)， 另 一 个 有 实用 意义 
的 例子 如 下 ， 某 厂 每 天 在 当天 成 品 中 抽样 估计 其 废品 率 2。 从 当 
天 看 , 2 是 一 单纯 的 未 知 数 ， 但 从 较 长 一 个 时 期 看 , 每 天 都 有 一 个 
罗 值 , 其 值 因 随 机 因素 的 作用 逐日 有 些 波动 。 本 日 的 p 值 可 合理 
地 视 为 隐 机 变量 p 的 一 个 可 能 值 。 如 果 我 们 有 相当 长 一 个 时 期 的 
迁 日 废品 率 记 录 , 则 可 以 相当 精确 地 定 出 2p 的 先 验 分 布 . 

在 另 一 些 情况 下 ， 把 参数 9 作为 一 个 随机 变量 这 种 看 法 是 的 
强 前 。 鲁 如 , 要 估计 的 0 是 一 个 铁 矿 的 矿 厂 含 铁 百 分 率 。 这 时 , 要 
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把 9 看 成 随机 变量 ， 就 要 设想 这 铁 矿 是 无 穷 多 “类 似 ” 铁 矿 的 一 个 
样品 , 这 是 不 自然 的 ， 在 此 ,干净 利落 的 看 法 就 是 把 9 作为 一 个 村 
立 的 未 知 常数 ， 在 另 一 些 情况 下 ， 昌 则 把 6 作为 一 个 随机 变量 有 
一 定 的 理由 ， 但 人 们 对 它 的 先 验 知识 没有 确切 到 能 以 一 个 分 布 骨 
出 的 程度 。 例如 , 我 们 可 能 知道 , 某 工 厂 的 废品 率 4 经 常 在 0.01 
附近 波动 ,偶尔 也 取 很 接近 0 或 1 之 值 ,但 我 们 的 识 知 还 不 够 确切 
到 可 以 写 出 0 的 先 验 分 布 。 按照 Bayes 学 派 的 主张 ， 即 使 在 这 种 
情况 下 , 也 必须 提出 一 个 分 布 作 为 日 的 先 验 分 布 。 这 可 以 是 通过 
大 致 的 估计 ,或 渗 杂 着 主观 设想 的 成 份 以 至 全 然 是 主观 的 ,或 是 数 
学 上 的 一 种 方便 形式 (如 所 谓 共 罗 先 验 分 布 , 见 本 节 (五 )) ,什么 都 
可 以 。 

既 已 有 了 20 的 分 布 ( 先 验 分 布 ), 以 及 给 定 8 的 条 件 下 子 的 条 
件 分 布 ( 祥 本 分 布 )， 就 可 以 定 下 随机 变量 (9, 立 ) 的 联合 概率 分 
布 .在 这 个 联合 分 布 之 下 下 的 分 布 , 称 为 的 边缘 分 布 。 不 要 
把 后 者 与 苹 的 样本 分 布 混 为 一 谈 , 样本 分 布 与 0 有 关 . 边缘 分 布 
是 祥 本 分 布 对 9 的 “平均 ”( 按 先 验 分 布 的 概率 去 平均 )， 它 是 与 9 
无 关 的 .， 因 此 ，Bayes 统计 推断 问题 可 以 提成 ， 有 一 个 随机 变量 
(9, 于 )， 其 联合 分 布 完全 已 知 ,但 9 不 能 观察 而 只 能 观测 马 . 要 
由 及 去 推断 0. 

现在 来 引进 在 Bayes 统计 中 极 重 要 的 后 验 分 布 的 概念 . 

定义 5.2 在 得 到 样本 茸 =z 后 , 8 的 后 验 分 布 , 就 是 在 给 定 

于 =w 的 条 件 下 ,9 的 条 件 分 布 . 

后 验 分 布 既 与 有 关 ， 也 与 先 验 分 布 瑟 及 于. 的 样本 分 布 族 
有 关 , 它 是 按 通 常 概率 论 中 计算 条 件 分 布 的 公式 去 确定 的 ， 例 如 ， 
设 的 分 布 有 概率 密度 f(z, 0), 而 0 的 先 验 分 布 五 有 密度 函数 
(0), 则 由 概率 论 中 计算 条 件 密度 的 公式 , 知 0 的 条 件 密 度 , 即 后 
验 密度 ,为 


hCOlo) ~ flo, OO /| fo PhP)dp. (6.4) 


(6. 全 右边 分 刁 只 与 ?有 关 而 与 4 无 关 . 由 于 这 个 原因 ， 有 果 分 绽 
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之 值 没 有 必要 计算 出 来 , 观 以 后 的 例子 可 知 。 现在 举 几 个 简单 例 
子 。 

例 5. 卫 设 耳 ~~ 二 项 分 布 B(n, p)， 给 定 p 的 先 验 分 布 为 
(0, 1) 均 勾 分 布 RC0, 1)， 由 (5.4)， 知 8 的 后 验 密 度 为 ( 当 样 本 
太一 w 有 时 ) ,… 


MP 四 =oc( ) pC1— — Pp) op (tp)"". 《5.5) 


此 处 ce, 0; 都 是 只 与 2 有 关 的 数 ， 密 度 (5.5) 属 于 Beta 分 布 族 
( 见 (4.89) 式 ). 由 此 知 朱 必 为 TB(z 十 二 w+1 一 轨 , 后 验 分 布 就 
是 Beta 分 布 B(w 十 1, n 十 1 一 w) (参看 (4.89) 式 前 后 一 段 话 )， 

例 5.2 设 屋 ,三 ,人 1 人 (a, aa， 未知 而 已 知 ， 给 尘 
0 的 先 验 分 布 为 ,， a~N(1, oz)， 在 有 了 样本 w 一 (m1,，…， ws) 后 ， 
ca 的 后 验 密度 为 


xX 


Ce )ae. 


Te 
mr 
此 式 分 子 整 理 后 有 6s,oexp( 一 (9g 一 作 3/277), 其 中 


0 
1 Ca (5.6) 
和 


因此 ,h(ajs) 作 为 4 的 沙 数 , 是 正 态 分 布 入 (tf, 六 ) 的 密度 、 即 e 的 
后 验 分 布 仍 为 正 态 分 布 , 其 均值 方差 由 (5.6) 定 出 . 
按照 Bayes 学 派 的 观点 ， 后 验 分 布 综 会 了 我 们 关于 日 的 光 验 


信息 (反映 在 先 验 分 布 中 ) 和 样本 @ 中 关于 乡 的 信息 (这 后 者 与 桩 
本 分 布 有 关 )。 如 果 说 , 先 验 分 布 概括 了 我 们 在 试验 前 关于 吃 的 认 
识 , 则 经 过 试验 得 到 样本 w 后 ,我 们 的 认识 有 了 变化 。 现在 (抽样 
后 ) 我 们 对 2 的 认识 总 结 在 后 验 分 布 中 .Bayes 学 派 认 为 ,样本 的 
唯一 作用 就 在 于 它 使 我 们 对 日 的 认识 起 了 运 个 转化 .这 一 点 从 
(一 ) 中 那个 例子 看 得 很 清楚 ; 如 果 我 们 不 知道 抽出 的 球 的 颜色 ( 即 
不 知 样本 到 的 值 ), 那 我 们 只 能 说 , 合子 为 金 , 银 、 铜 的 可 能 性 分 别 
为 5/12, 4/12 和 3/12.， 一旦 知道 了 球 的 颜色 , 例如 为 红 球 , 这 些 
概率 就 变 了 : 变 为 70/81, 8/81i, 3/81. 这 时 , 比方 说 , 我 们 对 金 合 
的 可 能 性 估计 比 抽 球 前 高 得 多 . 这 些 道理 说 起 来 好 象 很 抽象 , 其 
实 是 很 平易 而 常见 之 事 ， 例 如 ， 人 们 对 某 事 件 发 展 前 途 几 个 可 能 
性 有 所 估计 ( 先 验 知识 )， 在 获得 了 新 的 情报 后 ， 对 这 几 种 可 能 性 
大 小 的 估计 就 可 能 改变 ， 比 方 说 , 原来 认为 不 其 可 能 的 结局 , 现在 
认为 颇 有 可 能 或 大 有 可 能 了 . 

拿 例 5.1 来 说 , 先 验 分 布 为 p~R(0，, 1), 表示 在 抽样 前 , 人 们 
对 wp 取 各 种 值 的 可 能 性 都 认为 一 样 
大 , 这 个 规定 叫做 同等 无 知 的 原则 ， 
通俗 地 说 ， 就 是 我 们 对 p 实在 是 无 
所 知 ， 只 好 认为 它 取 一 切 值 都 有 同 
Ey 等 可 能 了 ”，。 抽 % 个 产品 检查 发 现 

废品 有 we 个 ， 算 出 2 的 后 验 密度 如 
上 图 ， 在 此 , p 仍 有 可 能 取 (C0, 1) 内 任何 值 , 但 机 会 大 小 不 处 处 一 
样 了 ， 在 w/n 这 一 点 附近 可 能 性 最 大 , 而 接近 0, 1 处 则 很 小 ， 这 
样 我 们 对 bp 的 知识 就 比 原来 更 确定 了 一 些 ， 例 5.2 也 可 以 这 样 解 
释 : 抽样 前 ， 对 a 的 认识 为 ga~ 入 (jw, 夏 )， 方差 有 怠 这 么 大 ; 抽 
样 后 ,对 a 的 认识 为 ajw~WCt, 太 )， 方 差 太 < 妇 (这 由 (5.6) 显 
然 ;. 方差 愈 小 表示 这 个 量 散布 程度 小 , 而 关于 它 的 认识 也 就 更 确 


定 一 些 ? 


h=(p|z) 


工 风 


1 当然 , 这 只 是 通俗 的 说 法 , 从 统计 的 观点 看 , p 有 同等 可 能 取 一 切 值 这 一 点 , 吧 
有 映 了 对 2 的 一 种 知识 , 


db。 


广义 先 验 分 布 “ 按 前 面 所 说 , 9 的 先 验 分 布 应 是 一 个 概率 分 

布 ,但 有 时 ，(5.4) 式 中 的 函数 三 非 密度 , 但 满足 条 件 : 1 人 Kb)>>0 
”于 B@ 上 、2° 对 任何 样本 2，(5. 人 式 右边 分 母 的 积分 大 于 0 且 有 
限 ， 这 时 , h(9 1) 作为 9 的 函数 , 仍 满足 密度 函数 的 条 件 (h(9)z) 


>0, | h(914)a9 一 1 在 这 种 情况 下 ， 可 以 形式 地 把 妨 看 成 是 9 


一 个 “ 先 验 密度 ”, 而 仍 以 (5.4) 作 为 其 后 验 密 度 、 这 纯粹 是 一 个 
形式 的 转换 规则 , 已 无 条 件 分 布 的 意义 .满足 这 种 条 件 而 非 密 度 


的 妨 称 为 9 的 广义 先 验 密度 . 如 果 有 |，h(0)a9~e 而 0<0<o%， 
则 只 须 以 十 h(9) 代 将 (9)， 就 得 到 真正 的 先 验 密度 。 这 种 情况 
没有 实质 性 的 新 东西 ,有 意义 的 广义 先 验 密度 是 满足 


| h(O) dO =o0 (5.7) 
的 那 种 及 ， 通 常 把 56.7) 式 作为 广义 先 验 密度 定义 中 的 一 个 要 求 , 
广义 先 验 密度 的 作用 可 由 下 从 看 出 ， 


例 5.3 设 1 ”3 一 (DO 1), 参数 0 未 知 . 在 抽样 前 ， 
我 们 认为 8 取 ( 一 oo, 0) 内 的 一 切 值 都 是 等 可 能 的 。 这 可 以 用 一 
个 先 验 概率 ‘密度 "(0)=1 去 刻 划 ， 因 为 人 1.dgg~ co， psd 不 
是 通常 意义 下 的 概率 密度 ， 但 著 以 h=1, Jo, 人 ) 一 (2m)-"/， 
smp[ 副 (一 072] 代入 5. 人 式 ， 不 难 算出 Ag /三 - 
exp[ 一 wz% 一 9)”/, 这 是 入 (zx, 1/w) 的 密度 。 因此, h 三 1 是 一 个 
广义 先 验 密度 、 


(三 ) Bayes 统计 推断 的 原则 
我 们 已 指出 ， 对 Bayes 统计 而 言 ， 除 了 给 出 样本 及 其 分 布 族 


1 读者 不 应 对 这 一 段 话 产生 误解 ,认为 后 验 知识 一 定 比 先 验 知识 “更 确切 "(比方 
说 : 8 的 先 验方 差 一 定 比 后 验方 差 小 ) 。 容易 举例 证 明 并 非 如 此 。 实质 之 点 
是 :后 验 知识 是 有 了 样本 以 后 ,关于 9 的 新 认识 ， 
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外 ,还 必须 给 出 参数 的 先 验 分 布 .样本 的 唯一 作用 在 于 把 对 9 的 认 
识 由 先 验 分 布 转化 为 后 验 分 布 。 在 这 个 认识 的 基础 上 , 我 们 就 可 
以 提出 下 面 的 基本 原则 .。 

Bayes 统计 推断 的 原则 ”对 参数 9 所 作 的 任何 推断 (估计 .、 
检验 等 ) 必 须 基于 且 只 能 基于 0 的 后 验 分 布 . 

此 原则 是 这 样 理解 的 : 一 经 由 样本 w 算出 了 9 的 后 验 分 布 ,就 
设想 我 们 除了 这 后 验 分 布 之 外 ,其余 的 东西 (样本 值 .样本 分 布 . 先 
验 分 布 ) 全 忘记 了 . 这 时 ,对 8 作 推断 的 唯一 凭借 就 是 这 后 验 分 布 . 
更 具体 一 些 : 如 果 你 在 对 9 作 推 断 的 过 程 中 需要 和 作 什 么 打算 ,或 引 
进 什么 规则 帮助 你 作 推 断 时 , 这 种 计算 只 能 用 到 后 验 分 布 , 这 种 规 
则 不 能 依赖 于 后 验 分 布 以 外 的 东西 ,尤其 是 不 能 利用 样本 的 分 布 ， 
例如 , 无 篇 性 这 个 规则 就 不 能 用 .因为 ,一 个 估计 是 否 无 偏 与 样本 
分 布 族 有 关 , 不 单 是 后 验 分 布 能 决定 得 了 的 。 下 面 的 例子 使 我 们 
清楚 地 看 到 这 原则 实质 之 所 在 . 

例 5.4 和 矩 估计 不 适合 Bayes 推断 原则 ， 而 在 一 定 的 先 验 分 
布 或 广义 先 验 分 布 之 下 , 极 大 似 然 估计 适合 Bayes 推断 原则 . 

事实 上 ,设想 人 家 把 9 的 后 验 分 布告 诉 你 了 ,但 你 对 样本 值 本 
身 及 样本 分 布 族 毫 无 所 知 ， 你 怎样 去 算出 样本 矩 和 总 体 矩 ? 没有 
这 个 你 怎么 能 作答 估计 ? 但 是 , 若 先 验 分 布 是 @ 上 的 均匀 分 布 ( 即 
M0)=1 于 日 上 , 当 | mg 一 co 时 为 广义 先 验 分 布 ), 则 不 难看 到 ， 
存在 只 与 桩 本 > 有 关 的 常数 oo>0, 使 

h(O|%)—cof (%, 0), 0€Q. 
此 处 (81s) 为 后 验 密度 ,了 (z%,9) 为 似 然 函 数 . MLE 6 是 使 (2,0) 
《作为 8 的 函数 ) 达 到 最 大 ,这 与 4(9|wz) 达 到 最 大 是 一 回 事 . 既然 知 
道 了 有 (8|z), 只 要 找 6 使 有 (91s) 一 sup h(91%) 就 行 ， 而 这 个 除了 
h(01z) 外 ,并 不 需要 知道 其 他 东西 . 

核心 之 点 在 于 (关于 这 一 点 的 批评 以 后 再 谈 ) ，Bayes 主义 者 
昌 也 用 到 样本 的 分 布 ,但 只 是 利用 分 布 的 数学 形式 , 将 其 与 先 验 分 
布 配合 以 达到 后 验 分 布 ， 古 典 学 派对 样本 分 布 赋予 一 种 频率 解 
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森 , 因此 , 在 进行 推断 时 ,不 能 忘记 这 样 一 点 ;: 手头 这 个 洋 本 只 是 
无 限 次 可 能 的 试验 结果 中 的 一 具体 实现 。 在 进行 推 基 时 ， 不仅 要 
考虑 到 现 有 的 w， 还 要 考 嵌 到 那些 没有 出 现 的 可 能 的 2 值 ， 这 斌 
必须 涉及 样本 分 布 。Bayes 学 派 反 对 把 现 有 2 放 在 “无 限 多 可 能 
值 之 一 ”这 个 背景 下 去 考察 . 认为 : 既然 我 们 手头 只 有 z, 我 们 的 
推断 只 能 根据 它 , 而 不 能 去 想到 虽然 可 能 ,但 我 们 实际 没有 观察 到 
的 那 种 % 值 ， 这 样 ,当然 也 就 排斥 了 使 用 样本 分 布 的 可 能 性 . 


(四 ) Bayes 推断 的 具体 实施 

按照 上 段 标明 的 基本 原则 , 可 以 说 , 统计 学 家 的 任务 就 只 在 于 
算出 后 验 分 布 ( 当 然 ,为 算出 后 验 分 布 ， 须 定 出 先 验 分 布 、 样 本 分 
布 , 并 抽样 得 到 mw， 这 些 工 作 中 统计 学 家 也 要 起 作用 )， 他 可 以 把 
这 后 验 分 布 报告 使 用 者 ,让 后 者 从 中 得 出 与 他 问题 有 关 的 结论 .但 
这 样 做 过 于 第 统 了 。 可 以 从 统计 学 的 角度 ,针对 若干 常见 的 推 其 
问题 , 提出 一 些 供 选择 的 、 实 施 推断 的 办 法 ， 

1. 点 估计 ”原则 是 ; 找 后 验 分 布 的 某 个 有 代表 性 的 特征 数字 
去 估计 6， 例如 ,后 验 分 布 的 均值 或 中 位 数 .或 使 后 验 密 度 及 (61%) 
达到 景 大 的 6 去 估计 6， 最 后 这 个 信 计 里 广义 极 大 似 然 估计 ， 举 


” 儿 个 例子 . 


例 5.5 考虑 例 5.1， 不 难 算出 ,分 布 Blo+1, “二 1 个 的 
均 什 为 
万 到- (5.8) 
而 广义 极 大 似 然 估计 就 是 通常 的 MLE， 即 $ 一 w/w。 暂时 把 关于 
先 验 分 布 的 争论 放 在 一 边 ， 而 把 (5.8) 纯 粹 看 成 为 对 分 的 一 个 修 
正 . 我 们 也 看 到 , 5 与 台 相 比 有 这 样 的 优点 当 “一 0 或 x 一 "时 ， 
有 一 0 或 1， 这 种 估计 未 免 太极 端 一 些 , 而 则 分 别 为 二 于 及 
"二 ,不 为 0 也 不 为 +， 这 个 估计 看 上 去 显得 合理 些 . 
后 验 分 布 中 位 数 要 由 不 完全 Beia 分 布 表 决定 , 比较 复杂 些 . 
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例 5.6 考虑 例 5.2， 已 算出 & 的 后 验 分 布 为 N(#, 站),i 信 
兄 (5.6) 式 。 由 正 态 分 布 的 性 质 , 知 用 三 种 方法 估计 < 的 结果 相 
同 , 都 是 

这 是 一 个 重要 的 Bayes 估计 ， 这 个 估计 有 趣 之 处 在 于 它 生 动 
地 体现 了 这 样 一 点 ，Bayes 方法 综合 了 6 的 先 验 信息 与 样本 信 
息 . 车 只 有 先 验 信息 而 无 样本 ， 则 因 96~WCw, z?)， 我 们 别 无 他 
法 , 只 能 用 估计 6， 这 是 一 个 极端 。 另 一 个 极端 是 只 有 样本 信 
息 ， 这 时 ,根据 以 前 的 知识 , 我 们 知道 肝 是 一 个 良好 估计 . 当 两 
种 信息 具备 时 ，Bayes 估计 是 这 两 个 极端 的 加 权 平 均 ， 权 的 比 为 


1 :这 个 比值 也 很 有 意思 ; m 愈 小 ,9 的 先 验 知识 愈 确切 , 它 


二 : 
的 重要 性 也 愈 大 ， 故 权 与 方差 可 成 反比 ,又 肝 的 方差 为 o/m 
根据 同样 的 理由 ， 其 权 应 与 - 乞 成 比例 。 这 表明 ， 当 先 验 知识 


很 确定 时 , 只 有 极 明显 的 现时 证 据 才 能 使 我 们 改变 看 法 . 

其 他 的 例子 我 们 不 一 一 列举 了 , 因为 这 都 是 一 些 机 械 的 计算 ， 
没有 多 少 兴味 .我 们 再 提出 一 个 多 少 使 初学 者 有 些 困扰 之 点 来 谈 
一 谈 ， 问 题 如 下 : 既然 昭 Bayes 学 派 观 点 看 , 8 是 一 个 有 一 定 分 布 
的 随机 变量 ， 那 么 , “估计 02 的 确切 含义 是 什么 ? 是 不 是 说 要 估计 
一 个 随机 变量 ? 如 果 是 , “估计 随机 变量 ”的 意义 何在 ? 回答 是 : 我 
们 估计 的 是 随机 变量 日 在 一 个 特定 场合 下 所 取 的 特定 值 ， 这 一 点 
就 废品 率 2 这 个 例子 看 得 很 清楚 : 不 同 的 批 p 有 不 同 的 值 ， 在 这 
个 意义 上 wp 是 随机 的 . 我 们 要 估计 的 不 是 这 个 抽象 的 p, 而 是 摆 
在 我 们 面前 这 一 批 产品 的 p 值 ， 但 这 一 来 又 有 下 面 的 问题 既 如 
比 , 则 2 是 一 个 确定 的 未 知 值 ， 其 后 验 分 布 作 何 解释 ? 你 不 妨 这 样 
想 ， 在 抽样 得 到 z(m 个 样品 中 废品 个 数 ) 后 ， 我 们 并 无 办 法 确切 地 
定 出 这 一 批 的 2 值 , 因 而 可 考虑 给 人 们 这 样 一 个 回答 ， 

“根据 我 们 以 前 对 史 的 了 解 ( 先 验 分 布 )， 及 现在 观察 的 结果 
(样本 z), 我 们 推断 : 未 知 的 史 有 90% 的 可 能 性 入 0.01 有 5 和 的 
可 能 性 在 0.01 到 0.03 之 间 , 有 5 多 的 可 能 性 超过 0.03%”, 
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我 们 想 , 绝 大 多 数 人 都 会 承认 , 以 上 的 陈述 确实 可 视 为 问题 的 
一 种 回答 . 即使 在 日 常生 活 中 这 类 说 法 也 累 见 不 鲜 . 如 “完成 这 
次 工作 , 有 90% 的 可 能 性 一 星期 就 够 了 ， 有 10% 的 可 能 性 要 超 
过 一 星期 "” 这 个 说 法 丝毫 没有 否定 , 完成 工作 所 需 天 数 是 一 确定 
的 未 知 数 ， 这 就 是 后 验 分 布 的 含义 。 当然 , 在 许多 时 候 需 要 拿 出 
一 个 更 确定 的 回答 . 这 时 , 后 验 分 布 均值 和 广义 极 大 似 然 估 计 等 
提供 了 可 能 的 选择 . 

这 种 论点 就 必然 要 容许 概率 的 非 频 率 解 释 . 因为 ， 从 频率 的 
观点 看 ,说 “一 个 确定 的 未 知 值 <1 的 可 能 性 为 0.90”, 是 毫 无 意义 
的 . . 

2. 假设 检验 ”问题 提 法 仍 如 (3.32) 的 形式 ,没有 两 样 。 具体 
检验 方法 如 下 : 算出 8 的 后 验 分 布 P(8|z) 后 ,计算 Bx 和 Br 的 后 
验 概率 

Paw) "= P(OEOnIL), pr (2)=P(0EOr|2). (5.9) 
其 意义 是 : 在 综合 先 验 和 样本 信息 的 情况 下 , 发 现 0 落 在 @x 内 的 
可 能 性 为 pa(%), 落 在 @r 内 的 可 能 性 为 pr(z)， 因 此 提出 这 样 的 
检验 法 则 ; 
当 2pa(Z)>1/23 时 接受 囊 , 当 pa(%w) 过 1/2 时 否定 互 . 
(5.10) 
车 pa(z) 一 1/2, 则 接受 或 否定 都 可 以 . 

习惯 于 从 NP 理论 的 观点 看 待 假设 检验 问题 的 人 ， 可 能 会 提 
出 如 下 的 异议 : 这 个 作法 没有 考虑 到 互 和 五 的 相对 重要 性 ,或 更 
确切 地 说 , 没有 考虑 到 两 类 错误 后 果 的 差异 . 在 NP 理论 中 选 定 
水 平和 a 就 是 为 了 这 一 点 ,对 这 个 异议 的 回答 是 . 这 反映 了 纯 科学 的 
“推断 "与 采取 一 定 “ 行 动 ”( 行 动 有 其 后 果 ) 之 间 的 差异 。 推 断 的 目 
的 是 在 于 给 问题 一 个 看 来 最 好 的 回答 而 不 计 其 利害 后 果 。 拿 此 处 
的 问题 来 说 , 设想 你 处 在 这 样 一 个 地 位 : 有 一 个 事件 4, 其 可 能 性 
为 0.6. 在 做 试验 前 让 你 预测 4 发 生还 是 不 发 生 , 若 你 对 此 预测 不 
承担 任何 后 果 , 当然 会 预测 4 发 生 。 但 如 你 这 个 预测 是 一 个 要 担 
负 后 果 的 行动 (例如 ， 若 预测 4 发 生 而 实际 上 并 未 发 生 ,， 损失 
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1000 元 .反之 ,车 预测 4 不 发 生 而 发 生 了 , 损失 0.1 元 )， 你 的 选 
择 就 不 能 单 根 据 0.6>17/3 这 一 点 了 . 

Bayes 方法 也 可 以 把 采取 行动 的 后 果 考 虑 进来 . 这 时 就 不 一 
定 用 (5.10)， 这 一 点 到 8 5.2 再 谈 . 

例 5.7 设 样本 互 ~ 六 (9, 100),9 的 先 验 分 布 为 6~N(100，, 
225)，、 对 各 观察 一 次 得 到 115， 要 检验 假设 H: 90<9<110<30 雪 
90 或 9>110. 

按 例 5.2 中 的 计算 (w=1, o? 一 100, 一 100, ?一 225), 得 知 
当政 一 115 时 ,48 的 后 验 分 布 为 N(110.38, 69.23)。 于 是 


Pr(115) ~ Vo J 天 


x 人 oxp[— (0—110.88)2/188.46]d0—0.478 


(此 积分 可 由 查 正 态 分 布 表 得 到 )。 由 于 pa(115) 过 1/2, 否定 原 假 
设 卫 , 

例 5.8 设 样本 z~N(0, 1)， 先 验 分 布 五 是 这 样 的 ， 它 在 
0 一 0 一 点 集中 了 概率 po， 剩 下 的 概率 1 一 po 按 正 窟 和 NC(4, ) 分 


配给 一 ce<g0<co, 9 关 0， 即 在 {一 2 过 09< 之 co, 0 关 0 这 个 焦 上 有 


概率 密度 (1 一 po -7 于 exp[ 一 (9 一 jp)3/25](9=0 这 点 是 否 除 


外 不 要 紧 , 因为 有 密度 时 , 一 个 点 的 概率 为 0)。 要 检验 假设 五 :9 
一 0<> 天 :0 基 0. 


如 果 先 验 分 布 的 概率 全 部 集中 在 9 一 0 一 点 ， 则 五 的 边缘 分 
-二 e-sa; 如 果 先 验 分 布 的 全 部 概率 都 按 W(uw， 5) 的 
规律 分 配 , 则 并 的 边缘 分 布 密度 应 为 


1 ~“(e~0 /2 1 一 (9 一 KJaA 3278 
二 一 6 一 一 -一 6 -27 00 
全 二 2 A/2m7 . 


-1 (一 
Vr exp | 3 下 | 
(这 是 入 Cp, 1 十 ) 的 密度 )， 暂 记 gz) 为 上 式 右边 ,而 各 (z) 一 mo 
8904。 


J e-*/3 十 (1 一 po)g(x), 则 有 


pr) = PO=01%)= p07 


so /nce), 


2r(2) 一 PCO 姑 0|jz) 一 | 
` 易 算 出 


pa(s)> pz(oe|2+ 必 | <4, 


| | 3 | 
A A (+log(l+7) +log 


Po ) 
1—po/" 
注意 当 多 0 时 ,接受 域 已 不 与 原点 对 称 . 
此 例 的 特色 在 于 ， 先 验 分 布 在 一 点 0 一 0 处 的 概率 大 于 0, 而 
在 这 点 之 外 有 密度 。 因为 9 严格 地 等 于 0 几乎 是 不 可 能 的 ， 故 
Bayes 学 派 认为 ,只 有 赋予 0 这 个 点 以 大 于 0 的 先 验 概率 , 问题 才 
是 有 意义 的 . 
3. 区 间 估 计 在 求 得 9 的 后 验 分 布 P(01z) 后 , 找 区 间 
[4(z), B(w)], 使 
P(A(z)<0<B(z)|2)=1—a. (65.11) 
ae (0, 1) 为 给 定 的 数 .，(5.11) 式 中 的 1 一 a 在 Bayes 统计 中 没有 
专 名 ， 故 称 之 为 后 验 置 信 度 . 适合 (5.11) 的 任何 [4(w), B(%w)]， 
称 为 9 的 后 验 置 信 度 1 一 xc 的 区 间 估 计 . 一 般 , 适合 (5.11) 的 区 间 
[L4(z)，B(o)] 很 多 ,可 以 挑选 其 中 长 度 最 短 者 。 - 
例 5.9 设 昼 1 pp 一 CO 0”), os>>0 已 知 ，0 为 参数 . 
0 的 先 验 分 布 为 入 (%, 三 )， 据 例 5.2, 在 已 有 样本 卫 1,…, 玉 ,时 ， 
9 的 后 验 分 布 为 NGi, 六 ),t 入 由 (5.6) 式 给 出 ， 由 此 易 知 ,后 验 
置信 和 度 为 1 一 a 的 区 间 估 计 是 [t 一 xsys, t 填 ways]. 
例 5.10 设 瑟 ~ BCn, p)， 且 p 的 先 验 分 布 为 R(0, 1). 在 
例 5.1 中 已 得 到 wp 的 后 验 密度 为 (5.5) 式 ， 此 密度 作为 p 的 函数 
先 升 后 降 ， 由 此 易 知 ， 后 验 置 信和 度 为 1 一 a 的 区 间 估 计 [pi(%)， 
Zaz)] 由 以 下 的 关系 式 确 定 ( 简 记 p: 一 (2), 6 一 1 2); 
Pil—p)" “=—pE(1— pa)"®, 
? 20 人 6w， 


Pp p= (1 Bost n+1i—w‘), 
例 5.11 设 玉 1!, …， 及 ,为 从 具 Cauchy 分 布 密度 


fw, 9) ~ 一 co<z<co, 一 co<0 一 co 
(5.12) 
中 抽出 的 独立 随机 样本 ，98 的 先 验 分 布 为 N(0， 1). 则 2 的 后 验 
密度 为 ( 记 “一 (ca …, 2»)) 


h(g|%) =ere™? It [十 《ww 一 0)”] -1 


of 0-9/2 I [1 十 (%; 一 入 习 0) 
函数 及 (9|z) ( 变 元 为 g) 不 是 单 峰 的 ， 因 此 找 最 短 区 间 估 计 的 问题 
要 比 前 几 例 复杂 。 这 例 只 能 用 数值 解法 .ce 的 计算 需 用 数值 积 
分 .然后 , 可 以 考虑 取 以 样本 中 位 数 mv 为 中 心 的 区 间 ms 士 4， 当 
然 , 这 一 来 就 不 能 严格 遵守 区 间 最 短 的 要 求 . 

以 上 我 们 介绍 了 几 种 基本 类 型 的 统计 推断 问题 的 Bayes 处 理 
法 ， 其 他 间 题 也 是 按照 这 个 格式 处 理 ， 上 比方 说 ，9 的 参数 空间 8 
分 解 为 X>2 个 两 两 不 相交 的 部 分 8@1, …，,B;, 统计 推 其 问题 是 要 
在 个 命题 瑟 :96 E€6,, ;一 1，…, 中 选择 其 一 ， 有 了 样本 4 后 ， 
根据 样本 分 布 和 先 验 分 布 算出 9 的 后 验 分 布 P(91z), 由 此 算出 命 
题 吾 ;, 的 后 验 概 率 p(w) = P(BEBilz), 5 一 1，…, ,如 果 

PoP) 一 max p(w), 
则 选择 五 ,, 即 认为 0E@,， 自 然 ,实际 问题 一 般 不 象 前 面 的 例子 那 
么 单纯 。 而 往往 有 一 些 更 细致 的 问题 要 考虑 ， 甚 至 不 时 有 必要 对 
Bayes 方法 的 含义 作 某 种 引伸 ， 这 些 都 不 能 在 此 细 述 了 有 兴趣 


的 读者 可 参看 Boz 和 刁 锦 赛 合 著 的 <Bayesian Inference In 
Statistioal Analysisy . 


(五 ) 确定 先 验 分 布 的 方法 
用 Bayes 万 法 处 理 统计 推断 问题 的 前 提 是 给 出 8 的 先 验 分 
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布 ， 因 此 , 怎样 去 确定 先 验 分 布 的 问题 是 一 个 至 关 重 要 的 问题 , 在 
文献 中 提 到 过 的 方法 , 主要 有 以 下 一 些 . 

1. 客观 法 ”在 象 前 面 提 到 的 废品 率 p 的 那 类 例子 中 ,参数 本 
身 确 有 一 种 可 赋予 频率 解释 的 随机 性 ， 且 如 对 以 往 的 资料 有 些 积 
累 , 则 可 以 由 之 对 先 验 分 布 作 出 较 准 确 的 估计 .在 这 种 情况 下 , 先 
” 验 分 布 可 通过 这 种 估计 得 到 ， 由 于 这 种 方法 看 来 没有 渗 杂 多 少 人 
的 主观 因素 ,姑且 把 它 称 之 为 客观 法 . 

一 般 认为 , 即使 某 个 统计 学 着 对 Bayes 统计 持 否定 态度 , 他 也 
不 反对 在 先 验 分 布 可 以 “客观 ”地 定 出 的 条 件 下 ， 使 用 如 (四 ) 中 介 
绍 的 推断 方法 去 处 理 统计 问题 。 就 “纯正 ”的 Bayes 学 派 而 言 , 他 
们 也 不 反对 在 上 述 情况 下 确定 先 验 分 布 的 方法 ， 但 他 们 反对 把 这 
种 方法 赋予 频率 解释 ， 更 不 赞成 在 误 扬 的 意义 下 使 用 “客观 ”一 

在 不 少 情况 下 ， 以 往 积累 的 资料 并 不 是 直接 给 出 了 参数 在 当 
时 的 值 ,而 只 是 其 一 种 估计 ， 如 在 废品 率 的 例 中 , 以 往 的 资料 不 必 
逐日 给 出 废品 率 p 的 值 ， 更 可 能 的 是 逐日 进行 了 抽样 每 日 抽 
个 ,记录 了 其 中 的 废品 数 于 1， 予 s,… 等 。 利 用 它们 也 可 以 对 先 
验 分 布 进行 估计 ,或 更 一 般 地 ， 这 种 资料 可 以 以 某 种 方式 用 于 
Beyes 推断 ， 这 种 方法 叫做 经 验 Beyes 方法 ， 最早 内 英 Robbins 
在 1955 年 提出 来 . 

2. 主 枫 要 不 法“ 按 Bayes 学 派 的 说 法 ， 这 是 一 种 通过 “自我 
反省 ”去 确定 先 验 分 布 的 方法 ， 就 是 说 ,对 参数 9 取 菜 某 值 的 可 能 
性 多 大 , 通过 思考 , 觉得 该 如 何 ， 面 定 下 一 个 值 ， 有 人 用 一 种 “ 打 
睹 ”的 设想 作 了 形象 的 解释 、 设 9 可 能 信和 的 区 间 为 0<9<1, 先 一 


分 为 二 ; 4:0<9<1/2, B, 雪 <9<1， 有 人 要 和 你 打 睹 是 4 出 现 


还 是 如 出 现 。 如 果 你 经 过 “反省 ”" 定 下 这 样 一 个 数 &, 使 得 对 任何 
2<a 你 都 愿意 以 1:5 的 输赢 与 他 打 睹 ( 妈 . 若 4 出 现 你 得 荆 元 , 否 
则 付出 6 元 ), 则 表示 你 认为 4 的 可 能 性 , 即 0<0<1/3 的 概率 是 
[FA 
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本 书 作 者 觉得 ， 主 观 先 验 分 布 应 当 是 反映 了 个 人 以 往 对 9 的 
了 解 , 包括 经 验 知识 和 理论 知识 . 这 里 面 自然 也 有 由 其 他 人 获得 
而 经 他 吸收 的 经 验 和 理论 知识 ， 这 种 知识 可 能 没有 经 过 适当 的 组 
织 和 整理 . 当 他 需要 对 0 给 出 先 验 分 布 时 ， 他 经 过 “自我 反省 ”将 
这 些 经 验 和 知识 作 了 整理 . 这 样 提出 的 先 验 分 布 , 就 有 可 能 较 确 
切 地 反映 了 他 目前 关于 6 的 知识 ， 这 当然 还 不 能 保证 , 所 提出 的 
先 验 分 布 按 某 种 客观 标准 (如 果 可 以 提出 这 种 标准 的 话 ) 是 正确 
的 ， 只 有 这 样 去 理解 主观 概率 法 才 有 意义 ， 至 于 上 面 提 到 的 “ 打 
睹 ”一 说 ,作者 认为 是 没有 什么 意义 的 ， 充 其 量 不 过 是 一 种 循环 式 
的 论证 而 已 ,并 不 能 提供 什么 新 东西 . 

3. 同等 无 知 原则 这 原则 有 时 称 为 Bayes 假定 ， 以 废品 率 
2 为 例 ， 当 我 们 对 罗 并 无 所 知 时 ,我 们 只 好 先 验 地 认为 , p 以 同等 
机 会 取 (0, 1) 内 各 种 值 ,因而 以 (0, 1) 内 均匀 分 布 RC0, 1) 作 为 p 
的 先 验 分 布 。 这 就 是 所 谓 同 等 无 知 原则 . 

这 个 原则 有 -个 困难 .就 拿 上 鲍 来 说 , 如 果 我 们 对 p 无 所 知 ， 
则 对 p? 也 无 所 知 ， 因 此 按 同 等 无 知 的 原则 ， 也 可 以 取 BR(0, 1) 为 
PP 的 先 验 分 布 ， 但 这 时 p 的 先 验 分 布 就 不 是 ECO, 1) 了 . 

4. 无 信息 光 验 分 布 ”这 个 方法 在 某 种 意义 上 类 似 于 同等 无 
知 原则 .但 由 于 它 只 能 用 于 菜 些 特殊 类 型 的 分 布 族 的 参数 , 因而 
就 没有 上 面 提 到 的 那 种 困难 .我 们 举 几 个 例子 来 说 明 这 个 方法 . 

例如 , 设 总 体 分 布 有 密度 函数 f(z 一 0)， 一 co 二 9 二 o0.0 为 一 
个 位 置 参数 . 若 将 度量 原点 由 0 移 至 -e, 则 总 体 变 量 的 密度 变 为 
f(z 一 (9+c)).。 如 果 先 验 分 布 不 依赖 于 原点 的 选择 (这 就 是 本 例 
中 “无 信息 ”一 词 的 含义 )， 则 它 在 等 长 区 间 内 的 先 验 概 率 应 当 一 
样 , 换 句 话说 , 先 验 密度 应 当 恒 恒 等 于 1。 这 就 是 本 多 中 的 无 信息 先 
验 分 布 , 它 是 一 个 广义 先 验 分 布 . 


又 如 , 设 总 体 分 布 有 密度 函数 地 (多 ), 9>0， 这 种 参数 9 
称 为 刻度 参数 ， 因 为 , 车 将 度量 单位 由 1 改 为 二 ， 则 总 体 变 景 的 
密度 变 为 访 -(- 刍 -)， 如 果 先 验 分 布 不 依赖 于 刻度 的 选择 (这 是 
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本 阅 中 “元 信息 * 的 含义 ), 则 对 任何 4,3,c, 0<m<5, co>0, 8 落 在 
[a, 5] 内 的 先 验 概率 ,应 等 于 其 落 在 [cg, c5] 内 的 先 验 概率 ， 不 难 


看 出 , 这 只 有 在 先 验 密度 为 玫 ( 当 9>0，9<0 时 为 0) 时 才 可 能 . 


这 就 是 此 例 中 的 无 信息 先 验 分 布 , 它 也 是 一 个 广义 先 验 分 布 . 

由 以 上 两 俩 可 以 窥见 此 法 的 思想 ; 设 总 体 变量 卫 的 分 布 族 在 
某 种 变换 下 不 变 ( 以 上 两 例 中 ， 变换 分 别 是 全 一 玉 二 ec( 一 co<6< 
co) 和 及 0 驻 (0 过 ce 过 oo0)), 则 先 验 分 布 取 成 有 相应 的 不 变性 , 不 
可 拘泥 于 “无 信息 ”的 字面 意义 (这 很 难说 清楚 )， 而 不 如 把 它 理解 
为 一 种 与 分 布 族 的 特定 结构 (反映 在 对 一 定 的 变换 保持 不 变 ) 相 适 
应 的 先 验 分 布 ， 直 现 上 人 们 觉得 , 这 是 一 个 较 稳 妥 的 选择 ,而 可 能 

5， 共 辑 先 验 分 布 ” 这 是 一 个 基于 纯 数 学 考虑 的 选择 原则 . 定 
义 如 下 ; 设 为 6 的 一 个 先 验 分 布 族 , 如果 对 任 取 的 刁 E 多 及 样 
本 值 x, 后 验 分 布 总 属于 .FF 则 称 .是 一 个 共 胃 和 完 验 分 布 族 .， 由 
于 后 验 分 布 不 仅 依赖 于 五 和 ww 还 依赖 于 样本 分 布 族 . 因此 , 某 
一 指定 的 先 验 分 布 族 是 否 有 共 轿 性 , 要 视 样 本 分 布 族 而 定 . 

如 在 例 5.2 中 , 和 4 …， 有 ,~~ 入 (4, o?)。 当 & 的 先 验 分 布 为 

正 态 分 布 时 , 不 论 样 本 值 如 何 , a 的 后 验 分 布 总 是 正 态 的 ， 故 在 此 
例 中 , 正 态 分 布 族 是 一 个 共 罗 先 验 分 布 族 . 又 如 例 5.1. 若 取 2 
的 先 验 分 布 为 Beta 分 布 Be(w, 5), a>>0, 83>0， 则 易 见 Pp 的 后 验 
分 布 为 Be(Z 十 gc， % 十 8 一 六 ). 这 说 明 , Beta 分 布 族 {Be{4, 5): > 
0, 5>>0} 是 一 个 共 思 先 验 分 布 族 ， 下 面 再 举 几 个 例子 。 这些 例子 
说 明了 在 充分 统计 量 存在 的 情况 下 ， 确 定 共 思 先 验 分 布 族 的 一 般 
方法 ， 

例 5.12 设 开 …', 及 ,~ 和 Ww, 03)，& 已 知 而 o 为 未 知 参 
数 . 求 ogo 的 共 轧 先 验 分 布 族 . 


第 一 步 是 写 出 样本 的 概率 密度 (2w)-"?0™"exp (一 启 (z. 一 0)? 
/20”). 训 (es 一 a)* 为 充分 统计 重 ， 记 之 为 (注意 TP>0)， 然后 ， 
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确定 那些 dg，d>0, 使 
0<| oexp( —T/20") dr <o0. 
显然 ,一 切 9>>1 都 适合 这 个 要 求 ， 且 不 难 算 出 上 述 积分 值 为 ( 作 变 
数 代 换 = 一 7/2c92( 于 ) AT) 以 了 (4, 7) 记 一 分 
布 ,其 密度 为 
[T (SS )/2 bu |asoxp( — b/a’). 

( 当 o>>0. ogo 二 0 时 为 0) (5.18) 
则 {D(d, 5):0>1 5>0 为 c 的 一 个 共 斩 先 验 分 布 族 ， 事实 上 很 
容易 看 出 ,车 oo 有 人 先 验 分 布 Dld, ), 祥 本 = (wi ”””) wn ) ， 则 Oo 
的 后 验 分 布 为 刀 (@ 十 m 8 十 T/2). 

例 5.18 设 卫 1 …, 卫 ,~~ 和 N(g, 0*), g 和 oo 都 未 知 要 确 
定 (g, o) 的 共 罗 先 验 分 布 族 . : 

第 一 步 仍 是 写 出 梯 本 的 概率 密度 如 上 例 . 这 密度 函数 可 写 为 
(2x) 2"e eco 如果 把 此 函数 滋 以 一 个 适当 的 党 
数 , 则 可 得 到 (go) 的 一 个 密度 函数 . 细 察 此 密度 函数 , 知 其 有 如 
下 的 特点 ; tc 的 边缘 分 布 为 Dn,T 了 /2).2? 在 给 定 o 的 条 件 下 ， 
a 的 条 件 分 布 为 入 (ag, o3/nw)， 以 G(d, 5, pp, TN 记 (%, o) 的 这 样 
一 个 分 布 , 其 中 co 的 边缘 分 布 为 DC(4, 5), 而 在 给 定 oc 时 ，&a 的 条 
件 分 布 为 NCn, o3/7). 记 了 一 {G(d, 5b, pw, 7): d>1, b>0, 


一 oo<j 达 co, 7Y>0}+， 则 易 见 多 为 (ga) 的 一 个 共 斩 先 验 分 布 ， 


族 . 事实 上 ,车 (a, 5) 的 先 验 分 布 为 G(d, b, pp, 7), 则 (@,0, 子 1 
”5 他 ,) 的 联合 密度 为 
Oo exp(—b/o)o exp(—r(6— 1)/20°)o™ 


-exp( 一 Zo G)3/ 20). (5.14) 
0 为 一 个 与 a。 和 o 都 无 关 的 常数 ， 因 为 
v(a—p) + sa) mtr) (ot) 
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LD > 


+nz5(zs-— 0) /nt7) +7 
其 中 =nz 十 T4)/(n-+7), 知 (5.14) 式 可 写 为 


cn 
NI] Vai xp 30 tr) ) 


O01 为 一 个 与 4 和 o 都 无 关 的 常数 ， 细 察 此 式 , 知 它 就 是 G (d+" 


一 了 1 号, 所), 仍 属于 P， 这 证 明了 是 共 辐 完 验 分 


布 族 . 

例 与 .至 设 总 体 有 Poisson 分 布 . Pe(%) = 一 e060°/w!, ww 一 0,1, 
2,…, 980 为 参数 设 下 1,，…， 了 , 为 抽 自 此 总 体 的 独立 随机 样 
本 , 则 其 概率 函数 为 


I (e™°0™ /v1) =e-"08/ (wml. !), S—Dn. (5.15) 


”以 G(a,5) 记 带 参 疾 a,5 的 Gamma 分 布 , 即 有 密度 函数 (a?/T(B)) 
-er-o( 当 wz>0.z<0 时 为 0), 则 由 (5.15) 的 形式 易 见 ，Gamma 
分 布 族 .多 =- {G(a 5); g>0, 5>0} 是 0 的 一 个 共 孝 先 验 分 布 族 . 
事实 上 很 容易 验证 ， 若 9 有 先 验 分 布 GCa, 5) 而 样本 值 为 2, -…， 
ws 则 0 的 后 验 分 布 为 Gl(gw+n, 5 十 5). 

共 罗 先 验 分 布 并 不 是 从 9 取 种 种 值 的 可 能 性 大 小 的 考虑 出 
发 ,而 纯粹 是 为 了 数学 上 的 方便 ， 如 我 们 在 $5.2 中 将 看 到 的 , 有 
时 我 们 赋予 参 数 以 一 定 的 先 验 分 布 ， 倒 不 是 想 要 用 Bayes 统计 的 
观点 去 处 理 有 关 的 统计 推断 间 题 ， 而 是 为 了 在 数学 上 证 明 某 种 结 
果 , 或 作为 求 具有 某 种 优良 性 质 的 解 的 手段 ， 这 时 ,任何 先 验 分 布 
(不 管 它 是 否 符合 实际 )， 只 要 有 助 于 达到 这 个 目的 的 ,都 可 以 用 ， 
共 轿 先 验 分 布 由 于 其 特有 性 质 , 常 是 合宜 的 候选 者 ， 另 外 ,在 有 些 
场合 下 , 种 种 选 定 先 验 分 布 的 法 则 都 不 能 给 出 适当 的 结果 ， 这 时 ， 
共 思 先 验 分 布 由 于 其 在 计算 上 的 简单 方便 , 而 被 人 们 所 选用 . 
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(六 ) Bayes 学 派 与 频率 (古典 ) 学 派 的 争论 

频率 学 派 和 Bayes 学 派 是 当今 数理 统计 学 的 两 大 学 泥 . 统 而 
言 之 , 凡是 坚持 概率 的 频率 解释 , 因而 对 数理 统计 学 中 的 概念 、 结 
果 、 方 法 性 能 的 评价 等 , 都 必须 在 大 量 重复 的 意义 上 去 理解 的 , 都 
属于 频率 学 派 ， 自 本 世纪 和 初 数理 统计 大 发 展 以 来 , 一 些 起 领导 作 
用 的 学 者 ,如 Fisher, KK. Pearson, J.Noyman, 卫 . 9S. Pearson 等 ， 
都 属于 这 个 学 派 ?»，。 因此 直到 大 约 五 十 年 代为 止 ， 这 个 学 派 占 据 
了 主导 的 地 位 ， 近 二 、 三 十 年 以 来 , Bayes 学 派 迅 速 崛 起 ， 达 到 了 
可 与 频率 学 派 分 庭 抗 礼 的 程度 .与 频率 学 派 相 比 , 其 发 展 较 新 , 因 
此 人 们 ， 特 别 是 Bayes 学 派 中 人 ， 往 往 也 把 频率 学 派 称 为 古典 学 
派 . 

这 两 个 学 派 之 间 经 常 而 热烈 的 争论 ， 是 当代 数理 统计 学 发 展 
的 一 个 特有 的 现象 ， 为 此 而 发 表 了 许多 文章 和 言论 .双方 的 主要 
论点 已 由 学 者 们 充分 阐明 过 了 ,但 至 今 并 无 定论 。 不 过 ,似乎 双方 
卿 不 否定 。 这 两 个 学 派 的 方法 在 许多 具体 问题 中 的 应 用 , 都 给 出 
了 一 些 有 益 的 结果 .。 尽管 对 此 事 的 解释 各 有 不 同 , 在 Bayes 学 派 
中 有 些 人 看 来 , 频率 学 派 中 的 一 些 重 要 方法 之 所 以 能 站 住 脚 ,只 是 
因为 它 瞳 合 于 某 个 合理 的 Bayes 解 . 例 如 ,入 (6,1) 中 9 的 无 偏 信 
计 瑟 ， 愉 好 是 当 68 有 (广义 ) 先 验 密 度 有 (9)==1 时 的 Bayes 倘 计 . 
在 本 例 中 ,有 (9) 夺 1 是 所 谓 “ 无 信息 先 验 分 布 "， 因 而 旦 是 一 个 合 
理 的 Bayes 解 。 也 有 人 认为 : 入 (g, o”) 中 参数 4 的 tt 区 闻 估 计 之 
所 以 能 被 接受 ， 也 只 是 因为 它 是 一 定 的 (广义 ) 先 验 分 布下 的 
Bayes 解 。 频率 学 派 也 承认 Bayes 方法 在 一 些 情况 下 可 用 ， 但 限 
于 先 验 分 布 可 给 予 某 种 “客观 "解释 (实际 上 就 是 频率 解释 ) 的 时 
候 。 至 于 两 派 涉及 的 基本 哲学 观点 ， 看 来 是 无 法 调和 的 ， 很 可 能 


1) Fisher 的 思想 比较 复杂 ,大 体 上 说 ,可 以 把 他 归 入 频率 学 派 。 但 他 的 “Fiducial 
inference” 有 明显 地 背离 了 频 罕 学 派 的 基本 原则 ， 他 对 Bayes 学 派 总 的 是 持 否 
定 态度 的 , 但 他 的 某 些 言 论 却 有 着 Bayes 学 派 的 色彩 。 要 仔细 了 解 这 个 问题 ， 
有 必 村 阅读 Fisher 的 原著 , 尤其 是 他 与 Jefreys 等 人 争论 的 文章 。 
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在 应 用 中 的 表现 以 及 广大 的 合用 统计 方法 的 人 的 倾向 性 ， 将 是 次 
定 这 两 个 学 派 的 争论 的 前 途 的 决定 性 因素 . 

频率 学 派对 Bayes 学 派 的 批评 ， 主 要 集中 在 所 谓 主观 概率 以 
及 与 之 相关 的 先 验 分 布 的 确定 问题 上 ， 按 频 率 学 派 , 一 个 事件 的 
概率 可 以 用 大 景 重复 试验 之 下 事件 的 频率 来 解释 ， 这 种 解释 不 取 
决 于 认识 主体 ， 而 主观 概率 则 理解 为 认识 主体 对 事件 发 生 的 相信 
程度 . 坚持 频率 解释 的 人 认为 这 不 仅 难以 规 摸 ， 且 与 认识 主体 有 
关 , 没有 客观 性 , 因而 也 就 没有 科学 性 ， 以 此 ， 风 是 不 能 给 以 客观 
- 的 频率 解释 的 那 种 先 验 分 布 ,都 是 主观 随意 性 的 产物 , 是 不 可 接受 
的 。 当然 也 不 能 接受 那 种 建立 在 这 个 基础 上 的 统计 方法 , 认为 这 
样 作出 的 推断 缺乏 客观 的 科学 价值 . 例如 ，Fisher 在 提出 “信任 分 
布 ”的 概念 时 ,就 特别 将 它 与 Bayes 统计 中 的 “后 验 分 布 ? 划 清 界 
线 , 认 为 前 者 不 须 对 参数 作 任何 先 验 的 假定 ,而 后 者 则 必须 作 这 样 
的 假定 . 

Bayes 学 派对 这 种 批评 的 回答 , 归纳 起 来 有 这 样 几 点 . 

”二 .主观 概率 事实 上 是 人 们 常用 的 一 个 往 念 ， 例 如 , 人们 常 说 
“明天 下 雨 的 可 能 性 是 2/3” 这 类 的 话 。 这 话 没有 频率 解释 ， 但 普 
遍 觉得 它 有 一 种 可 理解 的 意义 ， 它 反映 了 说 话 者 对 “明天 下 雨 ”这 
件 事 的 相信 程度 、 甚 至 在 科学 上 也 有 这 种 说 法 , 例如, 按照 目前 积 
累 的 探测 结果 , 人 们 认为 “火星 上 有 生命 ”的 可 能 性 很 低 , 也 许 不 到 
万 分 之 一 。 因此， 网 成 主观 概率 概念 的 人 ， 常 把 它 说 成 是 反映 了 
说 话 者 对 有 关 事 件 的 知识 水 平 ( 即 根据 他 现 有 的 知识 而 作出 的 判 
断 )， 这 话 看 来 有 一 定 道理 , 不 过 仍 未 能 完全 解决 这 个 问题 , 主观 
概率 的 实质 是 什么 ,能 否 给 予 严 格 的 定义 , 它 是 否 真 能 起 任何 有 用 
的 作用 ,等 等 . z 

2. 在 涉及 到 采取 行动 且 必 须 为 此 承担 后 果 的 问题 (所谓 统 计 
判决 问题 , 见 $5.2) 中 , 人 们 了 和 解 的 情况 不 同 , 对 间 题 所 具有 的 知 
识 不 同 ( 这 会 反映 到 所 采用 的 先 验 分 布 不 同 ) ， 他 们 的 最 佳 行动 方 
案 也 应 有 所 不 同 ， 在 这 种 情况 下 , 不 同 的 人 有 不 同 的 先 验 分 布 是 
正常 的 , 要 求 所 谓 : 客 观 性 ”反倒 没有 意义 。 
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3. Bayes 学 派 认 为 ， 昌 则 古典 统计 没有 明白 使 用 先 验 分 布 ， 
但 事实 上 ,在 频率 学 派 观 点 之 下 导出 的 统计 推断 方法 , 也 是 某 种 潜 
在 的 先 验 分 布 之 下 的 Bayes 解 ， 前 面 我 们 已 提 到 过 两 个 这 祥 的 例 
子 ， 在 不 少 情况 下 ， 这 个 事实 上 的 先 验 分 布 往往 很 不 合理 . 例 
5.21 就 是 一 个 例子 。 因此 ，Bayes 学 派 认为 ,与 其 不 顾 这 个 事实 
而 否定 先 验 分 布 ,不 如 明确 承认 它 的 存在 ,反而 有 可 能 选用 较 好 的 
先 验 分 布 . 

从 (四 ) 段 中 的 一 些 例子 看 到 , Bayes 方法 有 一 个 优点 , 就 是 它 
求解 的 程序 简单 ; 只 要 算出 了 后 验 分 布 , 则 解 就 可 以 得 出 ， 纵 使 有 
什么 困难 , 也 是 计算 性 质 的， 不 象 在 古典 统计 中 , 问题 的 解决 往往 
取决 于 推导 出 复杂 的 抽样 分 布 ， 这 个 特点 受到 理论 训练 较 少 的 应 
用 者 的 欢迎 。 有 的 频率 学 派 的 学 者 对 此 有 所 批评 ， 认 为 这 是 把 问 
题 人 为 地 简单 化 了 且 容 易 导 至 混用，Bayes 学 派 则 认为 , Bayes 方 
法 抓 着 了 本 质 的 东西 而 避免 了 那些 无 谓 的 复杂 细节 (Bayes 学 派 
既然 否定 频率 观点 , 自然 就 不 认为 抽样 分 布 有 什么 意义 )、 至 于 它 
可 能 被 滥用 ; 那 是 使 用 者 的 问题 , 与 方法 本 身 无 关 ， 何况 , 古典 统 
计 方 法 也 存在 被 滥用 的 问题 . 

频率 学 派对 Bayes 学 派 还 有 这 样 一 个 批评 ; Bayes 方法 也 要 
以 样本 分 布 为 出 发 点 ， 这 种 分 布 通常 都 是 在 频率 的 意义 上 来 解释 
的 。 因 此 , Bayes 学 派 既 彻底 否定 频率 学 派 , 但 又 要 使 用 这 个 学 派 
的 工具 ， 对 于 这 个 批评 ，Bayes 学 派 很 少 作出 回答 ， 可 能 是 因为 ， 
这 个 不 一 致 性 确 是 一 个 难于 作出 信服 回答 的 问题 。 如果 作 一 个 御 
底 的 主观 概率 论 者 ， 就 必须 把 样本 分 布 看 成 是 刻 划 样本 取 各 种 值 
在 主观 上 的 相信 程度 ， 即使 这 样 也 还 不 能 解决 问题 ,因为 样本 是 
已 知 的 ， 而 Bayes 学 派 反对 把 已 有 桩 本 放 到 无 穷 多 可 能 样本 的 背 
景 下 去 考察 这 种 做 法 (这 将 导致 频率 解释 )、 故 推 到 极端 人 们 其 
至 不 能 谈论 样本 有 什么 分 布 的 问题 ， 因此 ，Bayes 学 派 只 能 把 样 
本 分 布 作为 其 方法 结构 中 的 一 个 组 成 部 分 ， 而 避免 去 涉及 对 它 的 
意义 的 解释 问题 . 

现在 反 过 来 谈 谈 Bayes 学 派对 频率 学 派 的 一 些 批评 
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批评 之 一 ”涉及 “频率 解释 ”本 身 ， 许 多 应 用 问题 是 一 次 性 
的 .在 严格 相同 甚至 大 致 相同 的 条 件 下 的 重复 , 事实 上 不 可 能 . 因 
此 ， 在 许多 情况 下 ， 统 计 概念 和 方法 的 频率 解释 完全 没有 现实 意 
义 . 这 种 频率 解释 的 根源 ， 来 自 于 把 样本 放 在 “无 穷 多 可 能 值 ” 的 
背景 下 去 考察 这 一 点 ， Bayes 学 派 认 为 ， 只 能 在 现 有 祥 本 的 基础 
上 去 处 理 问 题 ， 而 不 能 去 顾及 那 种 可 能 发 生 但 其 实 并 未 发 生 的 情 
况 。 这 个 批评 在 许多 情况 下 是 中 肯 的 。 问题 在 于 : 用 “相信 程度 ” 
去 取代 频率 解释 是 否 真 的 就 克服 了 这 个 困难 . 

批评 之 二 ”与 上 一 点 密切 相关 。 Bayes 学 派 认 为 ， 由 于 古典 
统计 基于 概率 的 频率 解释 、 因 此 , 所 导出 的 方法 (点 估计 、 区 间 估 
计 、 假 设 检验 等 ) 的 精度 和 可 车 度 也 只 是 大 量 重复 下 的 平均 值 ， 这 
是 名 义 性 的 , 且 是 在 事前 (抽样 前 ) 就 已 定 下 了 的 , 故 称 为 事前 精度 
(可 靠 度 ) . Bayes 学 派 认 为 , 这 种 不 顾 实际 的 样本 值 而 在 事前 规 
定 的 精度 和 不 靠 度 是 不 合理 的 , 且 往 往 与 实际 情况 大 相 径 庭 ， 直 
观 上 人 们 倾向 于 能 接受 的 是 : 统计 推断 的 精度 或 可 靠 度 如 何 ,应 与 
试验 结果 (样本 ) 有 关 ， 即 应 当 采 用 事后 精度 和 可 靠 度 . Bayes 学 
派 形式 上 符合 这 个 要 求 。 

例如 ,为 检验 一 个 假设 0E Bae>bE Bx, 选 定 水 平 一 0.05. 若 
原 假设 被 否定 了 ， 则 我 们 只 知道 犯错 误 的 机 会 是 0.05, 与 所 得 样 
本 无 关 ， 而 事实 上 人 们 觉得 ,车 问题 是 检验 六 (0, 1) 中 的 9<0, 则 
在 卫 ~2 时 否定 原 假设 ,与 在 卫 ~4 时 否定 原 假设 相 比 ,后 者 出 错 
的 危险 要 小 些 ， 在 Bayes 方法 , 则 我 们 算出 PC(0O<0|[ 对 ). 当 叉 = 
4 时 ， 此 条 件 概率 远 小 于 其 当 卫 =2 时 之 值 。 因此 虽 则 二 者 的 结 
果 都 是 否定 9<0, 其 可 车 程度 则 有 异 。 在 区 间 估 计 以 及 点 估计 方 
面 也 有 类 似 问 题 ， 下 面 的 例子 给 人 深刻 的 印象 。 

例 5.15 设 及 …， ,~R(0 一 立 ,0+ 交 )， _oo<g<oo, 
要 作 9 的 区 间 估计 .到 置 信 系 数 1-a 一 0.95, 令 包 = (max 和 二 
min 他 ,)/2， 由 于 名 一 9 的 分 布 与 9 无 关 , 可 找到 常数 6 使 
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Ps( | 一 0|<<6,) 一 0.95, 于 是 得 9 的 置信 系数 0.95 的 置信 区 间 为 
[6 一 0s, 十 0]。 这 区 间 的 可 靠 度 0.95, 以 及 反映 精度 的 区 间 长 
2c,, 都 是 前 定 的 ， 对 %==25 有 62s 一 0.056,; 区间 长 为 0.112. 

现 设 有 两 组 大 小 各 为 25 的 样本 ， 


v= 


乙 : max ,一 1.256，min 了 及 ,==0.261, 
7 Tt<25 


对 样本 甲 而 言 ,在 它 的 基础 上 ,未 知 参 数 0 仍 可 以 在 区 间 53 .278 一 
0.5, 3.275 十 0. = [2.778，3.77 四 内 活动 ， 一 个 长 为 0.112 的 


区 间 , 只 是 这 区 间 长 度 的 100 -0557 多 一 0.112， 因 此 ,如 某 人 获 


得 祥 本 甲 , 那么 ， 按 Neyman 理论 算出 的 , 名 义 上 可 靠 度 为 0.95 
的 区 间 , 事实 上 可 靠 度 不 过 0.11 而 已 . 

反之 ,如 某 人 获得 样本 乙 , 则 在 它 的 基础 上 , 我 们 可 以 百 分 之 
百 地 肯定 未 知 参 数 8 不 会 超出 区 间 信 .256 一 0.5，0.261- 寺 0. 二 
[0.756, 0.761]， 其 长 只 有 0.0383， 而 按 Neyman 理论 算出 的 区 间 
为 [0.708, 0.815] 。 这 个 区 间 包 含 了 [0.756, 0.76 才 ,其 长 几 为 后 
者 的 四 倍 , 而 可 靠 度 反 而 只 有 0.95， 这 显然 是 不 合理 的 . 

若 用 Bayes 方法 就 没有 这 个 问题 ， 如 在 样本 乙 的 情况 , 则 对 
任何 先 验 分 布 而 言 ， 后 验 分 布 的 概率 将 全 集中 在 区 间 [0.756， 
0.761] 内 .因此 , 这 个 区 闻 的 后 验 置 信和 度 为 1， 著 在 样本 甲 ， 且 规 
定 对 很 大 的 gc>>0, 9 的 先 验 分 布 为 均匀 分 布 RC0, a), 则 后 验 分 布 
将 是 [2.778，3.77 绰 内 的 均匀 分 布 , 一 个 后 验 置 信和 度 为 0.95 的 区 
间 , 其 长 将 达到 0.947, 而 不 是 由 Noyman 理论 给 出 的 0.112， 因 
此 ，Bayes 方法 所 给 的 事后 精度 和 可 靠 度 符合 实际 的 看 法 ， 我们 
留 给 读者 去 讨论 : 在 本 例 中 的 点 估计 人 的 精度 也 有 类 似 现象 ， 

Bayes 学 派 关于 事前 精度 (可靠 度 ) 的 批评 ， 确 是 揭示 了 频率 
学 派 的 一 个 重要 缺陷 。 在 有 些 情 况 下 , 这 个 缺陷 可 以 在 古典 统计 
的 范围 内 得 到 补救 ,例如 拟 合 优 度 检验 ， 如 果 不 止 是 给 出 一个“ 接 
受 ” 或 “否定 ”的 回答 , 而 是 给 出 氢 合 优 度 PLE>20) ( 见 $3.2), 则 
无 论 是 接受 或 否定 原 假设 , 这 个 数 可 以 提供 所 作 结 论 的 可 吾 性 ,对 
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于 入 (8, 1) 中 检验 9<0 的 问题 显然 也 可 作 类 似 处 理 ; 算出 
max Po( 导 >2) 一 Po( 人 >2) 和 max 忆 ( 写 > 和 一 Po( 生 > 全、 


后 者 比 前 者 小 很 多 ， 因 而 在 忌 一 4 时 , 否定 9<0 的 结论 ， 要 比 在 
和 一 2 时 作出 同一 结论 可 靠 得 多 . 对 区 闻 信 计 和 所 合 计 的 情况 则 
没有 类 似 的 简单 补救 办 法 . 

以 上 所 介绍 的 就 是 这 两 个 学 派 争 论 的 一 些 主要 问题 ， 还 有 一 
些 其 他 的 问题 ,在 此 不 一 一 细 述 了 .对 这 种 问题 ,目前 意见 还 比较 
分 歧 , 读 者 应 以 批 兹 的 眼光 对 待 种 种 论点 , 以 形成 自己 的 看 法 ， 


$5.2 统计 判决 理论 


(一 ) 引 富 

统计 学 家 A. Wald 在 1950 年 出 版 了 一 本 题 为 <Statistioal 
Decision Funotion>y 的 著作 ， 建 立 了 一 种 统一 地 处 理 各 种 统计 问 
题 的 理论 , 世 称 统计 判决 (或 决策 ) 理论 . 一般 把 Wald 上 述 著 作 
出 版 之 日 确定 为 这 理论 诞生 之 时 ， 但 在 Neyman 和 Pearson 于 
二 .三 十 年 代 记 发 展 的 假设 检验 理论 中 ,已 包含 这 个 理论 的 某 些 概 
念 的 萌芽 ， 特 别 是 把 统计 问题 提成 一 个 数学 最 优化 问题 的 解 这 一 . 
点 ,或 许 对 Wald 建立 其 理论 有 所 启发 . 

这 个 理论 的 建立 是 战 后 数理 统计 学 发 展 的 重大 事件 .从 理论 
上 说 , 它 通过 将 统计 问题 提成 数学 最 优化 问题 的 解 ,并 引进 形 形 色 
色 的 优良 性 准则 ， 不 仅 加 速 了 数理 统计 学 的 纯 数 学 化 趋势 的 一 面 
(这 种 趋势 是 否 有 益 和 可 取 是 一 有 争议 的 问题 ) ， 且 开拓 了 某 些 传 
统 分 支 的 研究 领域 和 提出 了 一 些 有 意义 的 统计 问题 。 例如 , 参数 
佑 计 这 个 分 支 在 判决 理论 的 影响 下 , 战 后 的 面貌 有 了 很 大 的 变化 . 
其 他 统计 分 支 也 程度 不 同 地 受到 这 个 理论 的 影响 ， 从 应 用 上 说 ， 
这 个 理论 通过 引进 “行动 ”的 概念 (用 一 个 数值 或 区 间 去 售 计 一 个 
未 知 参数 ,对 一 个 假设 检验 问题 采取 “接受 "或 “否定 ”的 决定 ,都 可 
看 作 是 一 种 行动 ), 以 及 因 行 动 而 承担 后 果 一 一 通过 一 个 被 称 作 损 
失 函 数 的 数量 去 表达 , 把 数理 统计 学 的 任务 ,推出 了 姑且 可 称 之 为 
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“发 现 事 实 ”或 “探求 科学 真理 的 单纯 推断 的 范围 .而 达到 以 追求 
更 大 的 经 济 利益 为 目标 的 决策 的 领域 ， 使 数理 统计 与 记 基 有 更 大 且 
“应 用 意义 . 

本 节 的 目的 是 对 Wald 理论 的 基本 要 点 作 一 个 简单 的 介 绍 . 
这 个 理论 可 以 说 不 属于 我 们 所 设想 的 统计 基础 课 的 范围 ， 但 为 了 
对 数理 统计 基础 有 一 个 较 全 面 的 认识 ， 了 解 这 理论 的 一 些 初 步 知 
识 是 有 必要 的 . 


(二 ) 统计 判决 问题 的 三 要 素 

设想 一 个 经 济 领导 工作 者 某 甲 要 对 其 业务 有 关 的 问题 作出 一 
项 决策 ， 决策 的 内 容 可 以 是 关于 某 一 种 产品 应 生产 多 少 , 或 是 某 
一 产品 价格 应 定 为 多 少 以 至 是 否 将 该 产品 投放 市 场 等 ， 这 种 决策 
是 根据 种 种 考虑 作出 ,也 不 一 定 就 要 涉及 统计 方法 。 如 果 它 适合 
以 下 的 条 件 , 那 就 必然 与 统计 方法 有 关 , 而 可 以 称 之 为 统计 决策 问 
题 ， 条 件 是 ， 在 作出 决策 所 依据 的 事实 中 ， 有 一 个 组 成 部 分 是 受 
到 随机 性 影响 的 观察 或 试验 数据 瑟 ( 样 本 )、 例 如 , 在 决定 某 一 种 
产品 的 生产 规模 时 ， 过 去 一 段 时 间 内 该 产品 的 销售 记录 是 依据 之 
一 ， 而 这 种 记录 是 受到 随机 性 影响 的 ， 样 本 下 有 概率 分 布 
Feo(z), 依赖 于 某 个 参数 9, 9 取 值 于 人 参数 空间 8， 为 了 易于 理解 ， 
我 们 还 不 妨 假 定 ,一 旦 知道 了 也 的 分 布 , 即 参数 9 的 值 , 则 能 够 明 
确 应 该 采取 的 决定 . 

这 样 , 菜 甲 在 作出 其 决定 时 , 必须 有 样本 素 且 规 定 了 样本 及 
的 概率 分 布 族 {Fo, 9EQ}.， 这 构成 统计 尖 决 问题 的 第 一 个 要 淋 . 

其 次 , 某 甲 还 必须 在 事前 就 明确 : 他 能 作 的 决定 有 那 一 些 ， 如 
在 上 例 中 , 若 在 考虑 的 时 期 内 该 产品 最 大 的 生产 能 力 为 w 则 某 甲 
可 以 决定 任 一 数 &E.[0, 四 ， 而 把 产量 定 为 &， 这 时 , 他 能 作 的 决 
定 的 全 体 , 可 以 用 区 间 [0, 中 来 表达 在 统计 判决 理论 中 , 常 把 一 
个 可 能 的 决定 (如 上 文 的 办 称 为 一 个 行动 . 而 一 切 可 能 的 决定 的 
全 体 , 如 上 文 的 fw, 可 , 则 称 为 该 问题 的 行动 空间 ,通常 用 多 来 记 ， 
又 如 ， 某 甲 面临 的 决策 是 :是 否 投放 该 产品 。 他 能 采取 的 决定 有 
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二 : 投放 , 或 不 投放 .这 分 别 可 用 代号 0 和 工 来 记 ， 这 时 ,问题 的 
行动 空间 为 作 =={0, 1}. 

行动 空间 是 统计 判决 问题 的 第 二 个 和 要素。 这 个 要 素 确 定 了 所 
要 解决 的 问题 的 性 质 ， 关 为 ,只 要 把 全 部 可 能 的 行动 都 罗列 出 来 ， 
我 们 就 会 明白 要 解决 的 是 什么 问题 . 

最 后 , 某 甲 还 必须 明确 , 他 在 采取 这 样 或 那样 的 行动 时 , 在 种 
种 情况 下 可 能 产生 的 后 果 。 这 后 果 不 论 其 性 质 如 何 , 都 必须 最 终 
地 归结 为 一 个 非 负 数量 一 一 比方 说 ,经济 上 损失 的 人 民 币 的 元 数 ， 
例如 ,车 某 甲 决定 的 生产 数量 过 大 而 市 场 滞销 , 则 将 造成 积压 . 需 
要 明确 每 积压 一 件 损失 多 少 元 。 如 生产 数量 过 少 , 则 利润 有 损失 ， 
要 确定 每 少 销 一 件 损失 多 少 元 ， 又 如 , 他 要 作 的 决定 是 , 是否 把 一 
批 可 能 有 些 问 题 的 产品 投放 市 前 。 若 有 问题 而 投放 , 则 信誉 上 有 
所 损失 .这 种 损失 也 必须 经 由 一 定 的 考虑 转换 为 经 济 上 的 损失 

我 们 规定 ， 若是 知道 了 样本 互 的 分 布 参数 0 的 值 ， 则 行动 空 
间 乡 中 每 一 个 行动 4 所 导致 的 损失 也 就 确定 了 。 换 名 话说 , 我们 
规定 ; 损失 是 参数 8 和 行动 QQ 的 前 数 , 记 为 L(d, 的 这 个 函数 称 
为 损失 函数 ,是 统计 判 决 问题 的 第 三 个 要 素 。 

例 &.16 ， 某 商 店 每 日 从 工厂 进货 一 批 计 六 件 . 商店 从 该 批 中 
抽取 w% 件 检验 , 根据 这 m 件 中 的 废品 数 屋 ， 决 定 是 否 接受 该 批 产 
品 。 若 接受 (行动 办 )， 则 每 件 废品 商店 损失 10 元 。 若 不 接受 ( 行 
动 ds), 则 该 店 当日 无 货 出 售 , 每 件 损失 利润 2 元 ， 要 决定 其 损失 
函数 . 

假定 检验 为 非 破坏 性 的 ， 且 mw/Ys0， 因 而 可 以 认为 下 ~ 
B(n, Pp), 参数 空间 为 0<p<1 这 就 是 本 问题 的 样本 分 布 族 . 行动 
空间 乡 = {dg, daj， 车 已 知 废 品 率 p, 则 该 批 中 有 废品 WP 件 , 商 
店 接受 这 些 废 品 造成 损失 10Np.。 车 不 接受 ， 则 放弃 了 该 批 中 的 
(1 一 p) 件 合格 品 ,损失 利润 2N(1 一 p)， 由 此 得 到 本 问题 的 损失 
函数 为 


”2 LN 人 当 5 一 2， 


KE 长 


0<p<1, (5.16) 
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在 许多 实际 问题 中 损失 的 计算 可 能 不 象 这 么 简单 明了 ， 事 实 
上 ,怎样 去 确定 损失 函数 使 之 与 实际 情况 符合 , 在 应 用 上 是 -- 件 很 
重要 且 困 难 之 事 , 需要 做 必要 的 调查 研究 工作 ， 在 此 我 们 强调 的 
是 ; 损失 必须 能 由 参数 值 9 及 行动 & 所 确定 。 车 经 过 研究 发 现 损 
失事 实 上 与 9 无 关 或 关系 很 小 , 那 就 说 明 ; 所 观察 的 对 象 (样本 马 ) 
事实 上 与 要 解决 的 问题 无 甚 关系， 这 种 观察 结果 就 对 问题 无 用 
了 .完全 可 能 : 行动 & 造成 的 损失 不 仅 与 9 有 关 , 还 与 其 他 一 些 因 
素 有 关 ， 如果 是 这 样 , 我 们 就 必须 假定 , 这 些 其 他 因素 已 通过 某 种 
考虑 辕 定 下 来 ， 因 而 行动 a 的 损失 只 取决 于 96。， 若 这 些 因 素 无 法 
固定, 则 必须 设法 取得 其 观察 值 , 把 9 的 含义 扩大 ， 以 达到 使 损失 
只 与 9 有关 的 目的 . 

在 论述 了 统计 判决 问题 的 三 要 素 后 ， 我 们 就 自然 而 然 地 会 想 
到 : 统计 判决 问题 的 解决 ,就 是 要 根据 样本 下 选择 一 定 的 行动 @& 
使 损失 尽 可 能 地 小 .因为 ,车 知道 了 6, 就 可 以 由 损失 函数 上 (4, 0) 
的 形式 看 出 何 种 行动 最 好 ， 而 样本 节 中 包含 了 关于 参数 9 的 信 
息 , 当然 有 助 于 a 的 选择 ， 

统计 判决 问题 的 这 种 提 法 , 使 统计 与 博弈 论 发 生 了 联系 ， 可 
以 把 大 自然 作为 博弈 的 一 方 , 她 掌握 了 9 的 秘密 ; 统计 学 家 为 另 一 
方 ,他 力求 所 采取 的 行动 4 能 获 致 尽 可 能 大 的 利益 (利益 是 损失 的 
反面 。 因 此 ， 也 可 以 用 “利益 函数 ”代替 损失 函数 ， 问 题 由 “使 损失 
最 小 ” 改 为 “使 利益 最 大 ”)、 不 辣 之 处 在 于 ; 大 自然 不 是 一 个 自觉 
的 行动 者 ,不 能 说 大 自然 的 目标 是 使 统计 学 家 的 损失 尽 可 能 大 . 

还 有 一 点 要 提 到 一 下 ， 此 处 没有 把 6 的 先 验 分 布 作为 统计 阐 


决 问题 的 要 素 之 一 ， 因 为 人 们 可 以 也 可 以 不 采取 Bayes 学 派 的 观 


点 来 处 理 统 计划 决 问 题 。 往 后 我 们 将 讨论 参数 0 被 赋予 先 验 分 布 
的 人 情况， 这 称 为 Bayes 判决 问题 . 


(三 ) 判决 函数 及 其 风险 函数 

设 给 定 了 一 统计 基 决 问题 的 三 要 素 :， 取 值 于 样本 空间 处 内 的 
样本 天 及 其 分 布 族 这 。 02E9j， 行动 空 间 驴 以 及 损失 基数 
s 320 « 


LI(d, 9). 问题 是 要 根据 样本 的 值 = 去 确定 一 个 行动 4。 先 不 谈 
选择 的 优良 性 问题 , 很 清楚 , 我 们 需要 的 是 这 样 一 个 规则 , 根据 它 ， 
就 可 以 每 当 有 了 样本 值 2 时 , 去 确定 一 个 行动 dg。 换言之 ,我 们 需 
可 的 是 一 个 定义 于 样本 空间 多 内 而 取 值 于 行动 空间 多 内 的 函数 . 
这 种 函数 称 为 判决 函数 或 决策 函数 . 
例如 ,在 前 面 提 到 的 商店 从 工厂 进货 的 那个 问题 中 , 损失 函数 
为 (5.16)， 一 个 可 以 考虑 的 判决 函数 是 
5( 及 )=di, 当 /mn<1/6; (HF)=d, BX/n>1/6. (5.17) 
形式 上 说 ， 任 何 一 个 判决 沙 数 8(z) 都 可 以 作为 所 给 的 统计 
判决 问题 的 解 ， 为 比较 其 优 劣 ,就 要 看 在 使 用 各 种 判决 函数 时 ,其 
所 造成 的 损失 如 何 . 设 样本 为 w， 则 按 判决 函数 8， 应 采取 行动 
5(z)， 车 参数 为 9, 则 由 此 造成 的 损失 为 2(8(z)， 9 这 个 量 与 
. 样本 值 z 有 关 , 因 而 也 是 随机 的 ， 考 虚 到 样本 分 布 为 了 ,(w), 知 采 
用 判决 函数 3 而 参数 为 0 时 ,平均 损失 为 
R(8, 0) = BLL(S(R), 0)] 


- | LC8(%), OAPs (5.18) 


(8, 0) 称 为 判决 函数 5 当 参数 取 值 9 时 的 风险 ， 而 RC6, 9) 作 
为 9 在 @ 上 的 西数 , 则 称 为 6 的 风险 函数 . 

例 5.17 再 考 虑 例 5.16, 取 判 决 函 数 (5.17), 来 计算 其 风险 
函数 ， 当 及 <m/6 时 ， 损 失 为 10Np， 当 于 >n/6 时 ， 损 失 为 
2N(1-p)， 于 是 按 定义 (5.18), 得 


67 多 
BC p)~10 Np I(, )p(1—p)"™ 


化 忽 
+2N (1-9), Ds PCD" 
按照 Wald 的 理论 ,评价 一 个 判决 函数 的 唯一 位 据 ,就 是 其 风 
险 函 数 ， 风 险 函 数 合 小 鳄 好 ， 因 此 , 若 存 在 这 样 一 个 判决 函数 8” 
使 对 任何 判决 函数 6 者 有 z 
及 (3 的 < 委 瑟 (3 0)， 对 任何 0€8， (5.19) 
es O21。 


则 称 ?为 此 判决 问题 的 一 致 最 优 解 (一 致 是 指 (5.19) 式 对 一 切 
2EG@ 都 成 立 )， 若 一 发 最 优 解 存在 ， 则 豪 无 疑问 应 采用 它 , 但 是 ， 
除了 在 某 些 没有 现实 意义 的 问题 以 外 , 一 致 最 优 解 不 存在 ， 因此 
我 们 必须 把 标准 放宽 些 ， 即 需要 引进 比 一 致 最 优 准 则 更 弱 的 优良 
准则 . 我们 将 在 以 后 儿 段 中 讨论 这 个 问题 . 


(四) 统计 推断 与 统计 判决 

统计 推断 和 统计 判决 有 什么 差别 和 联系 ? 在 有 的 统计 著作 中 
不 大 强调 这 个 差别 。 如 在 Wald 的 前 引 著 作 中 ,把 引进 判 次 理论 
的 目的 视 为 将 各 种 形式 不 同 的 统计 推断 问题 用 统一 的 方法 去 处 
理 . 也 有 不 少 学 者 强调 二 者 的 差别 , 认为 不 同 之 根本 点 在 于 ; 判决 
问题 要 考虑 行动 的 损失 , 而 统计 推断 问题 ,尽管 可 以 把 种 种 具体 推 
断 说 成 是 行动 , 但 不 考虑 行动 的 损失 问题 . 有 的 极端 的 意见 认为 
推断 与 判决 完全 是 两 回 事 . 本 书 作者 采取 中 庸 的 看 法 , 认为 不 能 
忽视 二 者 的 盖 别 ,但 也 要 承认 ,二 者 确 有 密切 联系 ， 

统计 推 斯 是 由 样本 他 推断 未 知 参 数 9， 此 处 “ 推 斯 ”一 词 是 
一 种 笼统 的 说 法 , 意 指 弄 清楚 与 86 有 关 的 某 种 情况 . 例如 ,9 等 于 
多 少 ? (估计 问题 )9 是 否 志 0? (检验 问题 ) 等 等 ， 按 流行 的 说 法 , 这 
是 一 种 探求 未 知 , 认识 真理 的 科学 研究 性 质 的 工作 .研究 者 力求 
使 其 结论 尽 可 能 与 实际 符合 ， 但 他 并 不 为 可 能 的 错误 担当 经 济 或 
其 他 后 果 。 例如 ,通过 用 种 种 方法 作 试验 估计 光 的 速度 ec。 我 们 力 
求 使 估计 的 误差 小 ， 但 当 估 计 有 和 较 大 误差 时 ， 并 不 会 “受罚 ”. 总 
之 ,在 统计 推断 问题 中 , 我 们 努力 想 出 一 些 办 法 使 推断 尽 可 能 正确 
而 不 去 考虑 损失 问题 。 例 如 极 大 似 然 估计 法 我们 从 “ 似 然 性 ”的 
角度 分 析 ， 觉 得 这 是 一 个 可 能 给 出 良好 估计 的 方法 ,, 因此 就 采用 
它 。 至 于 这 个 估计 是 某 在 某 一 问题 中 真能 使 某 种 意义 下 的 损失 尽 
可 能 小 , 则 不 予 考 虑 ， 对 似 然 比 检验 也 可 这 样 了 解 . 

统计 判决 问题 则 不 然 、 虽 则 从 某 种 意义 上 说 , 也 可 以 讲 判 决 
的 任务 是 通过 样本 于 弄 清 9 的 有 关 情 况 -- 一 因为 ， 若 已 知 和 出 
由 损失 函数 的 形状 可 定 出 最 优 行动 。 所 以 初 看 起 来 , 似乎 判决 问 
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题 的 解决 可 以 分 两 步 走 ; 第 一 步 用 对 9 作出 估计 全 ”第 二 步 找 
一 个 行动 ,使 L(g, 6) 达 到 最 小 ， 其 实 不 然 ， 这 样 做 出 的 解 通常 
不 能 使 风险 函数 在 一 定 意义 下 达到 最 小 ， 因此 , 我 们 打 一 开始 就 
须 盯 着 损失 ， 举 一 个 形象 的 例子 。 在 点 估计 中 无 偏 性 可 以 被 认 
为 具有 其 优点 ， 但 在 判决 问题 中 , 正 偏差 与 负 偏差 的 后 果 可 以 很 
不 一 样 ， 比 方 说 , 少 生产 了 少 得 些 利润 , 损失 小 些 ; 多 生产 了 造成 
积压 , 损失 大 些 .@ 在 这 种 情况 下 , 对 市 场 容量 的 一 个 略为 偏 低 的 估 
计 , 也 许 要 比 无 偏 估计 为 优 ， 另 外 , 由 于 不 同 的 当事者 所 具有 的 条 
件 不 同 ,同一 个 行动 所 造成 的 后 果 也 可 以 不 一 样 . 例如 仓库 设备 
较 紧 的 厂 ,在 发 生 积压 时 要 租用 他 人 的 仓库 而 付出 高 额 费 用 ,损失 
就 更 大 些 。 因 此 ， 同 一 个 解 可 能 适用 于 甲 而 不 适用 于 乙 。 在 推断 
问题 中 不 应 有 这 种 情况 , 因为 推断 的 任务 是 探求 真理 , 这 对 于 甲乙 
都 是 一 视 间 仁 的 . 
推断 与 判决 的 这 个 差别 产生 一 个 看 法 ， 认 为 在 推断 中 不 应 参 
入 主观 成 分 , 如 主观 先 验 分 布 之 类 的 东西 ， 而 判决 问题 的 解 , 因 与 
当事者 的 条 件 和 所 掌握 的 情报 有 关 ， 故 恰当 的 解 不 可 能 也 不 应 排 
除 主观 因素 ， 这 个 观点 就 一 般 而 论 无 疑 是 合理 的 ， 问 题 在 于 : 怎 
样 的 推断 可 以 被 认为 是 客观 的 , 甚至 是 否 存 在 这 种 推 判 ,都 是 有 争 
议 的 问题 ,例如 , 前面 已 提 到 过 , 有些 表面 上 不 涉及 先 验 分 布 的 解 ， 
实际 上 却 有 着 一 个 潜在 的 且 其 不 合理 的 先 验 分 布 . 
至 于 统计 判决 问题 与 推断 问题 的 联系 , 表面 上 看 , 在 于 任何 推 
断 都 可 以 赋予 行动 的 意义 ， 实 质 上 ,联系 在 于 , 统计 判 决 的 方法 可 
以 作为 产生 优良 推断 的 一 种 手段 ， 例 如 , “无 偏 佑 计 的 方差 愈 小 愈 
好 ”这 一 准则 , 表面 上 固然 可 以 从 纯 推 断 的 观点 去 解释 ,但 实质 上 ， 
它 无 非 是 在 平方 损失 ( 即 损失 函数 为 卫 (@& 9) 一 (9 一 0 小 之 下 的 最 
小 风险 的 估计 ， 当 采 用 种 种 不 同 的 损失 函数 时 , 就 可 以 得 到 种 种 
推断 方法 ， 在 有 些 问 题 中 , 对 一 类 广泛 的 损失 函数 来 说 , 最 优 推断 
是 一 致 的 ， 这 样 ,该 推断 方法 的 优良 性 就 得 到 更 多 方面 的 支持 , 例 
如 , 设 互 ， …, 下 (9 1), 为 估计 0, 车 恨 制 估计 为 无 偏 的 , 则 
不 仅 在 平方 损失 下 , 且 对 广大 的 一 类 损失 函数 ,样本 均值 耻 都 是 
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最 小 风险 估计 ， 这 样 , 对 作为 的 估计 的 优良 性 就 得 到 更 多 的 支 

总 之 ,尽管 在 推断 问题 中 不 涉及 到 当事者 的 损失 ,但 这 并 不 排 
斥 把 损失 这 个 概念 作为 产生 优良 统计 推断 方法 的 一 种 手段 ， 这 样 
一 来 ,由 于 损失 函数 的 灵活 人 性, 就 可 以 提出 大 量 的 优良 性 问题 , 从 
而 丰富 了 统计 推断 的 理论 和 方法 . 

例如 , 拿 假 设 检验 问题 来 说 ,从 纯 推 断 的 观点 ,就 是 按照 R. A、 
Fisher 的 作法 ,对 具体 的 样本 w 去 考察 它 对 原 假 设 或 对 立 假设 提 
供 了 多 大 的 支持 , 这 不 涉及 任何 损失 的 考虑 。 反 之 ,也 可 以 从 统计 
判决 的 观点 ,规定 当 决 定 正确 时 损失 为 0, 而 当 决 定 错误 时 损失 为 
1, 分 别 以 1, da 记 接 受 和 否定 原 假设 9E On (对 立 假设 为 06€ Bx) 
的 决定 ,并 以 Bo(9) 记 检验 go 的 功效 函数 , 则 作为 一 个 判决 函数 P， 
其 风险 函数 为 

(0)， 当 0€E On; 


: Rly, 0) 下 6 的 ， 当 OcGr 

于 是 , Neyman-Pearson 关于 控制 第 一 类 错误 概率 的 原则 , 可 以 用 
统计 判决 的 语言 描述 为 ， 指定 wE (0, 1), 把 风险 函数 (gp, 0) 在 
@z 上 的 值 控制 在 不 超过 x， 而 使 (yp, 外 在 Bx 上 尽 可 能 小 .我 
们 之 所 以 说 Neyman-Pearson 理论 包含 了 Wald 理论 的 一 些 概 
念 ,其 道理 可 以 由 这 里 看 出 来 。 而 且 , 由 此 我 们 更 进一步 领悟 到 ， 
Fisher 和 Neyman-Pearson 关于 假设 检验 理论 差别 之 所 在 , 是 纯 
推断 观点 与 判决 理论 观点 的 差异 . 

对 Neyman 的 置信 区 间 理 论 也 可 作 类 似 的 处 理 . 对 区 闻 售 
计 问 题 而 言 ， 可 以 把 行动 空间 乡 定义 为 一 切 区 间 [&4, 5] 的 集 ， 我 
们 可 定义 两 个 损失 函数 Li([g, 外, 四 和 La([a, 9], 9, 其 中 
0, a<0<b, 
le, 1, 9- 人 7 其 他 情况 、 
而 损失 Ls 则 反映 区 间 的 精度 , 例如 , 可 定义 为 
Lo [a, 84, 0) =b—a. 

这 时 ， 对 任 一 区 冯 估 计 6(%) 一 [4(z), B(z)]， 第 一 个 损失 二 导 
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致 风险 函数 
Ri(6, 0)=1— P(A(X)<I<B(T))., 
而 第 二 个 损失 Ls 的 风险 则 是 区 间 5(w) 的 平均 长 度 ， 
Pald, 6) = Ee [BCX) 一 4( 玉 )]. 
指定 置信 系数 1 一 a 可 理解 为 要 求 Bi(5, 9)<<a, 然后 在 这 个 条 件 
下 要 求 Ra(5, 9) 尽 可 能 小 ， 这 样 , 纯 推断 性 质 的 Neyman 区 间 信 
计 理 论 , 也 可 以 用 判决 问题 的 观点 去 描述 . 由 于 损失 函数 的 灵活 
性 ， 我 们 可 以 提出 多 种 多 样 的 问题 。 例 如， 可 以 只 引进 一 个 损失 
函数 
F([w, 51, 0)=la—0|l+15—0|. 
这 个 损失 同时 兼顾 了 信 计 [a, 幻 的 可 车 性 和 精确 性 的 方面 . 
不 言 而 喻 , 存在 着 下 面 的 问题 ; 取 怎样 的 损失 函数 最 可 能 导致 
良好 的 推断 ?如 果 问 题 确 是 纯 推 断 性 的 ,而 对 “良好 推断 一 词 又 无 
确切 的 定义 , 这 问题 是 无 法 解决 的 。 


(五 ) Bayes 准则 

前 已 说 过 ,一 臻 最 优 的 判决 函数 通常 不 存在 , 故 有 必要 引进 某 
种 限制 较 宽 的 优良 性 准则 。 如 果 我 们 考虑 参数 有 某 种 先 验 分 布 
如 (0)， 就 可 以 自然 地 引出 一 个 优良 性 准则 . 那 就 是 把 风险 函数 
(8, 9) 对 9 青 取 一 次 平均 ,得 


Ra(8) —B°LR(8, 0)] —| RC, OAH(O), (5.20) 


其 中 名 表示 期 望 值 是 对 9 求 的 。 BR(6) 称 为 判决 函 数 6 在 先 验 分 
布 吾 之 下 的 Bayes 风险 . Bayes` 风 险 达 到 最 小 的 判决 函数 称 为 
判决 问题 的 Bayes 解 ， 

定义 5.8 设 判决 函数 8 的 风险 函数 记 为 R(5, 6), 而 在 先 验 
分 布 吾 之 下 的 Bayes 风险 Ra(6) 由 (5.20) 式 定义 . 设 3 为 一 判 
决 函 数 ， 若 对 任何 判决 函数 8 都 有 Rak3 ) 生 Ra(3) 则 称 8 为 统 
计 判 决 问题 的 一 个 Bayes 解 ， 或 者 说 ，? 是 一 个 Bayes 判决 函 
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我 们 注意 到 ，(5.20) 是 风险 函数 如 (3, 四 以 先 验 分 布 且 为 权 
的 一 种 加 权 平 均 . 从 这 个 角度 看 ,我 们 可 以 完全 撤 开 Bayes 学 派 的 
观点 , 而 直接 把 五 解释 为 一 种 加 权 因 子 , 把 Rx(5) 视 为 衡量 5 的 
优良 性 的 一 项 综合 指标 。 这样, Bayes 准则 可 以 完全 从 频率 学 派 
的 观点 得 到 解释 . 在 这 里 , Bayes 统计 的 先 验 分 布 概念 只 是 起 了 这 
样 的 作用 : 当 有 理由 选择 太 作为 8 的 先 验 分 布 时 , 五 是 一 个 良好 
的 权 ，Bayes 判决 函数 究 许 频率 解释 (或 更 确切 地 说 , 不 须 从 先 验 
分 布 的 角度 去 解释 ) 这 一 点 ,是 Bayes 判决 问题 和 Bayes 推断 问题 
根本 差别 之 所 在 . 

往 下 考虑 求 Bayes 解 的 问题 .以 五 (91w) 记 当 样本 值 为 wm 
时 ,9 的 后 验 分 布 ， 又 设 dE 多 为 一 行动 . 

定义 5.4 设 了 ad, 20) 为 损失 函数 , 则 称 


R(dls) =| La, 9)H (dg|s) (5.21) 


为 当 得 到 样本 ”时 , 行动 d 的 后 验 风险 ， 换 句 话说 , 后 验 风险 就 
是 LQ, 0) 作 为 9 的 函数 在 后 验 分 布 之 下 的 期 望 人 

下 面 的 定理 称 为 后 验 风 险 最 小 原则 ， 它 告诉 我 们 怎样 去 寻求 
Bayes 判决 函数 - 

定理 5.1( 后 验 风 险 最 小 原则 ) 对 任何 样本 值 w, 车 存在 行动 
ds 使 后 验 风险 达到 最 小 , 即 


R(ds|%2)—min 好 (glz)， ， (5.29) 
则 由 下 式 所 定义 的 判决 函数 Sr; 
5zfo) = 四， 一 切 sE2 (5.23) 


是 一 个 Bayes 判决 函数 . 

证 设 5 为 任 一 判决 项 数 ， 则 由 定义 ， 知 8 的 Bayes 风险 为 
Ba(9) 一 瑟 0[D(C5CR， 0)].， BY.0’ 表示 求 期 望 值 时 , 把 天 和 
9 都 看 成 随机 的 . 现 分 两 步 计 算 Ba(5): 第 一 步 给 定 下 =w, 在 这 
个 条 件 下 计算 了 SC ) 8) 的 条 件 期 望 值 。 由 于 在 给 定 耻 ~% 时 
9 的 条 件 分 布 为 也 (91w), 知 这 个 条 件 期 望 值 为 
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| za(w)， HLA) = RCs) |2). (5.24) 
第 二 步 再 对 z 求 期 望 . 若 以 @ 记 浆 的 边缘 分 布 (参看 (二 )), 则 有 
Raz(5) -| BCG(Co)lo)dQ(). (5.25) 
由 (5.21)~(5.24), 知 对 任何 EF, 有 
RCSa(2) |o) = min R(dls) <RCG(g) 1), 
于 是 得 到 
Rn(8a)—| R(34(%)|2)adQ(e) 


<| RC(8(0) ls)dQ(e) = Ra(d). 
这 证 明了 本 定理 . z z 
例 5.18 设 问 题 为 售 计 参 数 9, 并 设 损失 为 平方 , Ld, 6) 一 
(6 一)?， 分 别 以 m(z) 和 o*(w) 记 后 验 分 布 瑟 (912) 的 均值 和 方 
差 , 则 有 


Rd|o 一 [一 (zc)]3 二 as(o)。 (5 .26) 
因此 立 见 Bayes 判决 函数 为 - 
3z( 四 一 m(o)， (5.27) 
其 Bayes 风险 为 z 
Ra(3a) —| 0" (2) dQC%). (5 .28) 
Q@ 为 卫 的 边缘 分 布 . 


就 是 说 ， 以 后 验 分 布 均值 去 估计 9， 是 本 问题 的 Bayes 解 . 
在 $5.1 第 (四 ) 自 中 讨论 Bayes 推断 时 , 也 曾 把 这 个 估计 提出 来 . 
但 在 该 处 , (5.27) 只 是 可 供 选 择 的 推断 之 一 ,而 在 此 处 则 是 唯一 的 
Bayes 解 . 

例 5.19 设 参数 9 有 两 个 可 能 值 091, 0。，。 样 本 分 布 有 概率 落 
数 f(wz, 0 由、 考虑 检验 问题 互 : 0= ge> 开 :0 一 0 损失 函数 定义 
为 (di: 接受 五 。: 否定 万 ) 
Tau 0)= Ld, 03)=0, Llds, gb) 一 4a. Lds, 0)—2, 
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又 设 8 的 先 验 分 布 五 为 : 有 (61) 一 p, 了 (98s) 一 1 一 p。 当 得 到 样本 
2 时 ,2 的 后 验 分 布 为 
H(i 2) pfx, 1)/ Tpf ly, 0 十 圭一 Do，0)]， 
H(0s|o)=(1—p)f(%, Oa)/ [pfiz, 01) + (i—p)f (zr, 9s)]. 
于 是 行动 ,tds 的 后 验 风 险 分 别 为 
R(d|lv) =a(l~—p)f (er, 09)/Tpf lz, 8)+(1—p) f(y, 09)], 
R(ds|%2) ~ bpf (%, 01)/[Lpf C2, 01) + (i—p)f (zr, 02)], 
按 定理 5.1, 知 此 问题 的 Bayes 解 为 
5 di， 当 Jfz， Oa)/f (w, 0) Eall1—p) /bp 
so 当 jf(z, 9) /fl%, 01)>al1— 
25 ZT, bg » Ci 2p) /by. 
' (8.29)- 
这 个 解 的 形式 与 Neyman-Pearson 基本 引 理 所 提供 的 UMP 检验 
符合 . 不 同 的 是 在 Neyzman-Pearson 理论 中 , 临界 值 由 给 定 的 检 
验 水 平 w 确定 ( 且 还 要 用 到 搬 生 ,ba)/ 大 总 ,及 ) 在 和 一 由 之 下 的 分 
布 ) , 而 在 此 处 则 取决 于 4, 8, 2 4 值 的 差异 反映 了 两 类 错误 后 
” 果 之 不 同 ， 这 自然 会 有 使 我 们 更 倾向 于 接受 或 者 否定 互 . 因此 ， 
a、5 值 的 选择 正好 起 着 水 平 w 的 选择 的 作用 . 在 此 又 一 次 看 到 
Neyman-Pearson 理论 与 判决 函数 的 联系 . 
在 有 的 情况 下 ,不 论 对 那个 判决 函数 6, 总 有 总 z(5) 一 co 这 
时 , 任 一 个 判决 函数 5 都 是 Bayes 判决 函数 ,在 这 个 情况 下 , Bayes 
准则 丧失 了 意义 ,但 是 , 后 验 风 险 最 小 的 解 仍 可 能 是 唯一 的 ， 从 
Bayes 风险 的 角度 看 , 这 个 解 轿 然 与 其 他 任何 解 一 样 , 但 是 从 其 他 
角度 看 则 可 能 有 其 优点 , 因此 , 常 把 在 定理 5.1 中 确定 的 后 验 风 险 
最 小 的 那个 判决 函数 , 称 为 推广 意义 下 的 Bayes 判决 函数 ， 
另外 ,在 Ba(8) 的 定义 全 .30) 式 中 ,五 ( 妥 不 一定 是 概率 分 布 ， 


也 可 以 是 广义 的 概率 分 布 , 即 可 以 有 | .a 互 (0)- ce， 若 把 豆 (g) 
看 作 权 而 不 赋予 先 验 分 布 的 意义 , 则 这 与 | d 五 (0) 一 1 的 情况 比 


并 无 本 质 不 同 ,而 我 们 仍 可 提出 zt5) 最 小 的 准则 ， 特 别 是 ,如 果 
象 $85. 攻 二 ) 中 那样 ， 由 五所 确定 的 “后 验 分 布 " 仍 确 是 真正 的 概 
。 228 ， 


率 分 布 , 则 定理 5.1 仍 有 效 ， 当 然 , 也 存在 这 样 的 问题 , 对 任何 3， 
有 | BR(5，6)d 吾 (9)~ co， 这 时 ， 与 互 为 真正 的 概率 分 布 的 情况 


一 样 ， 由 定理 5.1 确定 的 解 仍 可 能 有 某 种 优越 性 ， 可 称 之 为 推广 
意义 下 的 Bayes 解 . 

例 5.20 设 工 I, …, 于 ,~ 人 (9, 1), 要 估计 入 损失 函数 为 
L(d, 9) = (09 一)”, 先 验 分 布 为 广义 的 : 有 密度 有 9) 二 1，、 据 $65.1 
(二 )， 当 有 了 样本 值 21,…, mm 时，9 的 “后 验 分 布 ” 为 正 态 六 (az， 
1/m), 其 均值 为 上。 因为 损失 函数 为 卫 (d, 9)= (4 一 0)”， 知 Bayes 
解 为 

8Sz{ 闷 ) 一 部. (B.30) 
此 解 的 风险 函数 为 (及 一 站 ?==1/n, 而 Bayes 风险 为 


Rn(6n) -| 二 db =o0. 


因此 ,对 一 切 8 有 Ry(5) 一 co。 故 在 本 例 中 ，Bayes 准则 无 意义 ， 
但 是 ,由 定理 5.1 只 给 出 唯一 解 (5.30)， 而 这 个 解 也 确 有 其 优点 ， 


(六 ) 基 inimax 准则 
仍 以 BR(5, 0) 记 判决 函数 8 的 风险 函数 ， 台 为 参数 空间 ， 则 
当 采 用 判决 函数 3 时 ,使 用 者 可 能 遭受 的 最 大 风险 为 
M(6) ~max RC8, 0). (5.81) 


在 有 些 问 题 中 ,当事者 担心 出 现 最 坏 的 情况 ,其 时 风险 大 到 超出 所 
能 承担 的 程度 这 时 他 有 兴趣 于 考虑 这 样 的 判决 函数 5, 其 (6) 
能 尽 可 能 小 。 这 导致 以 下 的 准则 , 通常 称 为 Minimax 准则 或 极 
小 化 极 大 准则 . RS 人 
定义 5.5 设 3” 为 一 判 
决 函 数 . 若 对 任何 判决 函数 
6, 都 有 以 (5) 之 MM(5"), 则 称 
3 为 此 统计 判决 问题 的 
Minimax 解 ， 也 称 5° 为 Minimax 判决 函数 ， 当 问 题 为 估计 
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或 检验 时 , 也 称 5* 为 Minimax 估计 或 Minimax 检验 . 

关于 Minimax 解 的 研究 主要 集中 在 点 估计 ,在 这 方面 得 出 了 
不 少 的 深入 结果 . Minimax 准则 一 般 是 一 个 比较 保守 的 准则 . 形 
象 地 说 , 它 “ 不 求 得 到 很 多 , 但 求 不 失去 很 多 ”, 常 有 如 上 页 图 这 种 
情况 ,其 中 用 (81) < 了 (55), 故 按 Minimax 准则 而 言 ,51 优 于 3. 但 
是 通 观 二 老 的 风险 函数 ， 发 现 对 大 多 数 0 值 而 言 ，6s 优 于 9。 如 
时 我 们 没有 足够 的 先 验 信 息 认 为 处 在 ga, 2 之 间 , 就 很 难说 8 一 
定 优 于 3s 了 .因此 , Bayes 学 派 认为 ,只 是 在 人 们 对 于 0 的 先 验 分 
布 很 没有 把 握 的 时 候 ， 作 为 一 种 替代 , 才 使 用 Minimax 解 . 只 要 
对 先 验 分 布 有 一 定 的 把 握 , 则 宁肯 用 Bayes 准则 . 按 Bayes 学 派 的 
观点 , Bayes 准则 是 一 个 较 定 进 取 性 的 准则 , 因为 它 力图 最 大 限度 
地 使 用 已 有 信息 去 争取 最 好 的 结果 . 

Minimax 准则 的 一 个 不 方便 之 处 ， 在 于 求 Minimax 解 通 党 
比较 困难 . 对 若 于 重要 的 估计 问题 及 平方 损失 函数 ， 已 找到 了 
Minimaz 解 。 它们 大 都 是 通过 定理 5.2 和 5.3 中 提供 的 方法 获 
得 的 . 而且， 这 两 个 定理 与 其 说 是 求 Minimax 解 的 方法 ,不 如 说 
是 验证 某 一 特定 的 解 为 Minimax 解 的 方法 . 

定理 5.2 设 3 为 对 某 个 先 验 分 布 瑟 的 Bayes 解 ， 且 8 的 
风险 函数 恒 等 于 一 个 有 限 常数 ce，R(5", 9) oc 对 任何 9EGQz， 则 
56” 为 一 个 Minimax 解 . 

证 明 很 简单 . 若 3 不 是 Minimax 解 ， 则 将 存在 判决 函数 5, 
使 人 3) 一 “<c， 这 时 将 有 

Ra(8) =—| BG, WAH(O)<| M(H (0) 
一 0 一 6 一 有 ar) 
这 与 人 为 Minimax 解 相 矛盾 . 

例 5.231 设 了 ~B(n, 2), 要 估计 2， 损失 函数 为 (4 一 p)?, 要 
求 pn 的 Minimax 估计 . 

取 交 的 共 斩 先 验 分 布 Be(e, 2)， 则 当 样 本 了 取 值 时 , p 的 
后 验 分 布 为 Be(z 十 o wm% 十 8 一 2)。 由 于 损失 画 数 为 平方 (@ 一 中)2， 
# 230， 


由 例 5.18 知 ye 估计 为 此 Beta 分 布 的 期 望 值 ， 此 值 易 算出 为 
dw 2) = 二 其 风险 函数 为 


2 
R(So, P) 一 一 二 ,| -+ no -二 二 全 -2| 
= Varyp (KX /(ntot+b)) 


+{ 二 二 BR)+o) -ol . 


考虑 到 配 ,(( 节 ) 一 np,， Varp( 子 ) 一 np(1 一 p), 易 算出 

R(6%, p)— ntatd) {np(1—p)+ La (etd)pl". 
若 取 w=0= nm/2， 则 易 见 上 式 右 边 恒 等 于 一 个 常数 w/ [4(n 十 
ww )3， 于 是 按 定 理 5.1, 知 


人 六 /9 Vn/ Cw) = 


是 的 Minimax 估计 ， 

由 定理 5.1， 并 通过 这 个 实例 ， 我 们 注意 到 以 下 几 点 : 工 
Minimax 准则 从 其 形式 到 内 容 都 与 先 验 分 布 无 关 , 是 频率 学 派 也 
能 接受 的 一 个 概念 。 然 而 ,在 一 些 情况 下 ,由 这 个 准则 提供 的 解 却 
是 在 一 定 先 验 分 布下 的 Bayes 解 .2° 也 可 以 这 样 看 ， 本 例 中 引进 
的 先 验 分 布 Beta(wWm /2, MV mn/2), 完全 不 过 是 一 个 解 题 的 工具 ， 
不 必 赋 予 它 以 Bayes 学 派 的 那 种 意义 。 因此 , 人们 可 以 对 Bayes . 
学 派 的 基本 观点 持 异 议 ,但 不 能 否定 其 作用 .对 于 这 类 应 用 ( 即 作 
为 解 题 或 论证 的 手段 ) ， 频 率 学 派 自然 也 是 不 拒绝 的 . 3” 传统 的 
舍 计 5。 一 县 的 风险 函数 为 BR(560, p) 一 pC1 一 p)/%. 此 判决 冰 数 与 3 
的 风险 函数 如 下 页 左 图 所 示 。 由 图 看 出 , Mso)>4 5) 放 5o 非 
Minimax 解 ， 但 是 对 多 数值 ，R(60, Pp) 比 BR(5", Pp) 小 , 尤 以 当 
nn 大 时 为 然 ， 因 此， 除非 有 某 种 特殊 的 原因 ， 人 们 一 般 仍 宁肯 用 
50 而 不 用 8*、4°. Minimax 解 6" 所 相应 的 先 验 分 布 为 Beta 分 布 
Bita( Mn/2, wm/2), 其 密度 函数 的 图 形 如 下 页 右 图 所 示 ， 此 本 
数 关 于 p=1/3 对 称 ， 在 2 一 172 的 两 边 进 速 突 减 ， 尤 以 ww 大 渴 为 
然 .所 以 ,在 % 大 时 , 先 验 分 布 的 概率 极 大 地 集中 在 点 1/2 的 附近 
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如 果 我 们 所 有 的 关于 的 先 验 知识 并 未 提供 这 种 证 据 ( 即 先 验 概 
率 集 中 在 点 1/2 的 附近 ), 甚至 是 其 反面 (例如 ,废品 率 2 一般 较 小 ， 
其 先 验 分 布 的 概率 应 集中 在 p=0 附近 ), 则 我 们 没有 根据 认 为 ， 
Minimax 解 (5.32) 是 合理 的 .这 就 是 我 们 前 面 在 $5.1 (六 ) 段 中 
提 到 的 Bayes 学 派 的 那个 论点 ; 有 些 表面 上 不 涉及 先 验 分 布 的 解 ， 
事实 上 隐 含 着 其 不 合理 的 先 验 分 布 . 

定理 5.2 的 使 用 面 较 窗 ， 因 一 般 很 难 找到 一 个 其 风险 函数 为 
常数 的 Bayes 解 。 下面 的 定理 的 应 用 要 广 得 多 . 

定理 5.3 设 一 个 统计 判决 问题 在 先 验 分 布 Hy 之 下 的 
Bayes 解 为 Ses，Sx 的 Bayes 风险 为 rw 二 1, 2 …。 假 定 


lim mx 一 “一 “9， (5.33) 
又 设 人 5 为 一 判 愉 西数 ， 满足 条 件 
MCS* 2 <r, (5.34) 


则 人 为 此 判决 问题 的 Minimax 解 . 

证 ” 仍 用 反 证 法 . 设 3 非 Minimax 解 ， 则 存在 判决 函数 5， 
使 履 (3) 过 了 (8).。 则 由 (5.88)，(5.84)， 知 当 充分 大 时 ， 有 
M(6) 一 rsp， 于 是 6 在 先 验 分 布 了 之 下 的 Bayes 风险 Rx,(5) 
满足 

Ru,(S<M(H) <ry= Ra, (Oy). 

这 显然 与 5 是 先 验 分 布 卫 ,下 的 Bayes 解 了 矛盾 ， 因而 证 明了 本 定 
理 . 

例 5.282 设 和 ，… 和 XwvN( 1)， 损 失 函 数 为 Lld, 9 一 
.232 。 


(0 一 9)” 求 6 的 Minimax 估计 . 

找 一 串 先 验 分 布 { 且 x}， Hp 一 和 (0, 克 ), 一 1，2,…， 由 于 损 
失 函 数 为 (4 一 9)”, 依 例 5.18， 知 Bayes 解 为 后 验 分 布 的 均值 ， 因 
先 验 分 布 为 (0, 8?), 按 例 5.2 的 结果 ， 和 6s(2) ~ =npz/ (1 + mb?). 
其 风险 函数 为 

zu -0) 
Ven Pr) + | BY) 0) 
mh 多 
(1+np) (+n) 

而 5 的 Bayes 风险 为 : 在 0~W(0, 友 ) 的 条 件 下 求 上 式 右 边 的 期 
望 值 , 结果 为 


加 _ np IT 十 配 
mt ED 
显然 有 7=liml/n。 取 S (oz) 一 2， 则 忆 (3， 0)= 二 依 定理 


5.3, 证 明了 到 是 中 的 Minimax 估计 (在 平方 损失 椰 数 下 ). 

以 往 我 们 曾 证 明 过 ,单纯 作为 一 种 统计 推断 而 言 , 有 一 些 准则 
都 导致 这 信 计 量 全 . 例如， 天 是 的 扼 佑 计 、 极 大 似 然 估计， 
UMVUE 等 .这 里 又 证 明了 在 Minimax 准则 下 ， 蒜 也 是 解 、 仅 
从 推断 的 角度 看 ， 这 个 结果 也 是 有 意义 的 . 因为 它 从 一 个 新 的 角 
度 验 证 了 于 这 个 估计 的 优良 性 . 

定理 5.3 可 以 在 一 些 更 复杂 的 问题 中 使 用 ， 困 难 之 点 在 于 
怎样 去 看 出 那 一 串 具 有 定理 中 的 性 质 的 {Hx}. 在 不 少 问题 中 ， 
{如 让 是 从 共 轿 先 验 分 布 类 中 去 选 ， 进 一 步 讨论 已 超出 了 基础 课 
的 范围 ,不 在 此 给 出 了 . 


(七 ) 同 变 原 理 
上 两 段 讨 论 的 Bayes 准则 和 Minimax 准则 , 都 是 用 基 种 方法 
制定 一 个 优良 性 的 综合 指标 (Ba\6)，M 45) 等 ) 以 之 作为 比较 的 
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标准 。 另 一 类 制定 优良 性 准则 的 方法 是 , 先 对 判决 函数 8 提出 某 
种 看 来 是 合理 的 要 求 ， 只 考虑 满足 这 种 要 求 的 判决 函数 的 类 .o， 
然后 在 .x 内 寻求 一 臻 最 优 者 . 无 偏 性 就 是 这 样 一 种 要 求 . 本 段 
将 简单 地 介绍 一 下 另 一 个 这 样 的 要 求 , 即 同 变性 要 求 . 

我 们 从 一 个 简单 例子 入 手 ， 设 要 估计 某 物件 的 重量 <。 将 它 
放 在 一 架 天 平 上 称 量 次 ,得 样本 且 1,…， 了 及。， 我 们 用 某 个 估计 
量 5C( 卫 ,，…， 了 及 ,) (例如 下) 去 估计 4， 假定 了 1, …, ,~N(%, 
oo”). 

如 果 我 们 把 坐标 原点 移 至 一 6, 则 物件 的 重量 成 为 ce 十 a, 数据 
转换 为 了 :一 及 ,十 c, $1，…, n. 用 估计 量 5, 将 得 到 估计 和 值 
5{ 及 1 十 6c，，…， 卫 。 十 c).。 但 这 是 c+a 的 估计 ， 还 原 为 a 的 估计 ， 
应 是 
85( 昼 1 十 6, …， 于 ,+6) 一 6. (5.85) 
但 车 不 移动 原点 , 则 将 用 5( 革 1, …,， 互 ,) 佑 计 g， 于 是 , 车 我 们 提 
出 看 来 是 很 合理 的 要 求 : 估计 值 不 应 与 度量 原点 的 取 法 有 关 , 则 我 
们 必须 要 求 , 所 用 的 估计 量 5 满足 条 件 

6( 尺 1 十 6, …， 玉 ,十 0) 二 6( 玉 1 pv， 马 ,十 一 切实 数 6. 

(5.36) 

这 就 是 对 5 在 变换 { 耻 ! 一 也 ,++6, 6 一 1,…, 对 之 下 的 同 变性 要 
求 ， 满 足 这 个 要 求 的 估计 量 ， 称 为 同 变 估计 量 (在 给 定 的 变换 之 
下 ). 车 引进 了 一 定 的 损失 函数 ， 则 可 以 去 寻求 在 同 变 估计 类 中 ， 
其 风险 一 致 最 小 者 ， 它 称 为 最 优 同 变 估计 (在 一 定 变换 和 一 定 损 
失 之 下 )， 在 本 例 中 还 有 另 一 个 自然 的 变换 ， 即 {一 c 革 ,i 一 1， 
…, n, 0 过 6 过 co}， 这 相当 于 把 度量 单位 由 工 改 为 cr+ (例如 ， 由 
公斤 改 为 克 )， 相 应 的 同 变性 要 求 为 

De CX ) 一 06( 玉 1,…, 下 ) 一 切 oo>0，(5.37) 
我 们 注意 , 常见 估计 下 适合 这 两 个 变换 下 的 同 变 要 求 . 

这 个 例子 所 提出 的 概念 可 推广 到 一 般 的 统计 判决 问题 ， 因 为 
问题 较为 专门 ， 在 本 课程 中 只 能 满足 于 大 略 介绍 一 下 而 不 深入 其 
细节 ，-- 个 统计 判决 问题 要 运用 同 变性 , 必须 满足 以 下 两 个 要 求 ， 
334 。 


+. 能 定义 样本 空间 2 到 自身 之 上 的 一 些 一 一 对 应 的 变换 ， 
它们 构成 一 个 群 ， 而 且 ， 这 和 群 内 的 每 一 变换 都 把 样本 分 布 变 换 到 
样本 分 布 族 内 另 一 分 布 , 而 不 能 越 出 样本 分 布 族 . 

例如 , 变换 类 { 瑟 ;一 并 ,十 oj 一 1 mw， 一 co 过 6 之 oo}, 是 由 
样本 空间 多 ( 即 ” 维 欧 氏 空间 B") 到 2 上 的 一 个 变换 群 , co 一 0 相 
应 于 单位 变换 。 以 -c 代 e 得 到 逆 变 换 ， 由 一 c 和 cs 产生 的 两 
个 变换 之 积 ,等 于 由 ce 一 ci 士 o 产生 的 变换 ， 又 样本 分 布 经 变换 后 
仍 在 正 态 族 内 ， 落 卫 != 芋 ;十 0, 1 一 1 9 , ww， 则 站 1 …， Xi 
NTe，a2). 

经 过 样本 的 这 一 变换 ,样本 分 布 族 的 参数 也 起 了 变换 。 在 本 
例 中 为 w =a++6. 

2. 损失 函数 与 行动 空间 要 有 这 样 的 性 质 , 每 当 样 本 空间 的 一 
个 变换 对-> 玉 ' (如 上 例 的 了! 一 玉 十 0, 一 1,…, mn) 引 起 参数 0 
的 一 个 变换 9->9' (如 上 例 的 a>64 二 ec) 时 , 在 行动 空间 上 可 找到 一 
个 一 对 一 的 变换 d>V， 使 了 (a', 9) 一 L(gd, 9). 如 在 上 例 中 , 若 
执 失 函数 为 (a, @) 一 《9 一 g)?”， 则 可 在 行动 空间 中 引进 变换 0" 一 
d+c， 这 时 有 (d’, 6) =(d 一 4 ?一 (d 一 @). 

， 如果 这 些 条 件 都 满足 了 ,就 可 以 引进 如 下 的 定义 (记号 意义 如 
上 上述): 如 当 5(%) 一 d 时, 必 有 65(z) 一 @', 则 称 判 决 函 数 5( 在 给 定 
的 变换 群 下 ) 为 同 变 的 .由 此 可 见 , 同 变性 的 使 用 是 受到 不 少 局 限 
的 .不 仅 对 分 布 族 有 要 求 , 对 损失 函数 也 有 其 要 求 。 如 在 上 例 中 ， 
车 取 定 损失 西数 为 5(&，a) = -他 二 和 一 , 则 同 变性 不 可 用 。 一 般 ， 
同 变 性 的 使 用 多 限于 参数 为 位 置 和 刻度 参数 的 情况 . 

我 们 不 去 细 论 局 变性 在 统计 判决 中 的 种 种 应 用 和 理论 .只 举 
一 个 例子 , 就 是 在 上 述 问题 中 ,党 取 平 方 损 失 , 则 下 是 a 的 最 优 辣 
变 估计 ， 为 此 需要 下 面 的 有 用 的 引 理 . 

引 理 5.1 设 开 ，…， 和 Ne 02), 而 及 1 …， 三) 满 
足 条 件 : “XiTo …， 台 十 一 了 ET …, 了) 对 任何 实数 9”， 
则 总 与 了 (Xi …, 及 ,相互 独 立 . 
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事实 上 ， 作 正 交 变换 了 一 (了 …, 了 了。)' 一 Q( 卫 1,…， 于 n)， 
Q 的 第 一 行为 (< … ,天 )， 则 如 以 gs 记 @ 的 (四 元 ,将 
有 字 gy 一 0， 一 2,…, n， 按 引 理 1.1， 知 了 i,，…',， 了 ,独立 、 X 


一 了 J/M mn 只 与 了 ; 有关. 将 1，…， 玉 。) 表 为 Pi, …, 了 4 的 
函数 , 设 为 f( 蚤 1， "**y 及 ,) =g(Y, **", Y,). 当 ( 卫 1 ”> 了 ) 变 
换 为 (所 1 十 c， ”3 了 ,十 C) 时 ,了 :1， ”3 了 了。 分 别 变换 为 


Y'= +e)=Yi1+ Vo, 


VID Tt TY i=2, en. 

于 是 ,由 .To …， 及 ,十 0) 一 (XI,，，…，X,), 得 

(ZI 十 Am ce, Ye, *…, Y,)—g9(Y,, 2 .了 
此 式 对 一 切实 数 c 成 立 ， 这 表明 g( 了 1: …， 了 ,其 实 与 上: 无关， 
即 有 有 (Ya,…-, 了 ,) 的 形式 ， 故 得 

有 = Py Vn, f Ey, £1, Bo) —hYa, …， 了 了 ,). 
考虑 到 了 了 1, …, 了 相互 独立 ， 即 知 王 与 J(X …, 也 ,) 相 互 独 
立 ， 引 理 证 毕 . 

现 回 到 我 们 的 问题 , 取 a 的 任 一 同 迹 估计 2 并 记 60( 了 1 …，， 
no) 一 8(X， …， 天 ,) 一 昼 。 则 由 6 的 同 变 条 件 (5.36), 知 8o 满足 
So( 太 1 十 C6, …*， 已 十 0) 一 8o( 工 1， “3 ,)， 对 一 切实 数 c。 于 是 依 
引 理 5.1, 知 壮 与 3o(XZi， …， 和) 独立 ， 又 

R(8, 0) =— Efd( FR, Bn) — a] 
=E[(X a)+60(T, -…， 允 2， 
由 于 及 与 56 独立 ,有 
R(5, a)=Es(¥ -0+ BLT .…, TR,)] 
+2E,(£F—a) HLdo( FT, .…， 太 ,)] 
— He(R—a) + BLK *…, RDF—a) 
—R(X, o), 
对 一 切 & 都 成 立 。 于 是 证 明了 入 是 & 的 一 切 同 变 估 计 中 风险 一 
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致 最 小 者 (在 平方 损失 下 ), 妈 了 是 a 的 最 优 同 变 估计 . 


《 八 ) 容许 性 

最 后 我 们 来 谈 谈 由 一 致 最 优 性 的 考虑 所 引起 的 一 个 概念 ， 这 
个 概念 本 身 并 不 是 一 个 优良 性 准则 , 但 在 很 大 程度 上 可 以 说 , 它 是 
任何 优良 判决 函数 所 应 具备 的 一 个 条 件 . 

定义 5.6 仍 以 R(5，09) 记 判决 函数 5 的 风险 函数 。 若 存在 
另 一 个 判决 函数 51, 使 

1” 对 任何 89€E6, 有 RBR(51, 0)< 委 已 (3S，0). 

2” 至 少 存在 一 个 866E6, 使 BR(61, 00)<R(5, 09). 
则 称 8: 一 致 地 优 于 5, 而 5 称 为 是 不 可 容许 的 ， 反 之 ,车 不 存在 一 
致 地 优 于 6 的 51, 则 称 6 是 可 容许 的 . 

如 果 8 一 致 优 于 8， 则 当 采 用 53 时， 所 承担 的 风险 总 不 超过 
使 用 5 时 所 承担 的 , 且 确 在 某 些 场合 下 风险 更 小 .因此 , 若 把 风险 
大 小 作为 评价 羯 决 函数 优良 性 的 唯一 标准 ， 则 我 们 自 没 有 理由 使 
51 而 就 5. 就 是 说 , 5 是 不 允许 使 用 的 , 这 就 是 容许 性 一 词 的 由 来 ， 

一 个 判决 函数 的 容许 性 , 取决 于 该 判决 问题 的 各 要 素 , 尤其 是 
样本 分 布 族 和 损失 函数 , 因为 这 二 者 决定 了 风险 .另外 , 参数 空间 
的 范围 也 对 容许 性 有 影响 ， 例 如 , 设 Zi， …，X 一 六 (9 1), 损 失 
为 (4 一 0)?， 用 斑 估计 8. 车 9 的 范围 允许 在 (一 co,， co), 则 下 面 
将 证 明 它 是 容许 的 .反之 ,车 6 局 限于 a<90<5, ww 5 都 是 有 限 常 
数 , 则 很 明显 , 若 定 义 估 计量 

玉 ， 当 ob 
61( Fi, +, ZX,) -| 4， 当 马 一 ai 
5， 当 态 二 
则 6 将 一 致 优 于 是 ，. 这 一 点 在 直观 上 很 明显 ， 数学 上 也 很 容易 
证 明 RC6,, 人 天 BCX,， 6) 对 任何 06 [a, 妇 . 我 们 把 这 一 点 留 给 
读者 作为 练习 . 

容许 性 的 问题 就 在 于 , 在 一 给 定 的 统计 判决 问题 中 , 确定 那些 

判决 函数 可 容许 或 不 可 容许 , 这 一 点 极 难 作 到 。 有 了 时 ,可 以 讨论 某 
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一 特定 类 型 的 判决 函数 是 否 可 容许 , 例如 线性 估计 类 ,最 有 兴趣 也 
是 文献 中 研究 最 多 的 情况 ， 是 确定 某 一 特定 的 判决 函数 是 否 可 容 
许 ， 这 种 判决 函数 一 般 都 是 有 某 种 优良 性 ， 例 如， 是 问题 的 
Minimax 解 ,或 者 是 由 直观 方法 而 产生 的 . 这 方面 的 研究 工作 难 
度 很 大 , 因为 缺乏 一 般 的 有 效 方法 。 有 些 情况 可 用 下 而 的 定理 解 
决 . 

定理 5.4 设 55 为 在 某 先 验 分 布 之 下 的 Bayes 解 . 设 参 数 
空间 @ 是 mw 维 欧 氏 空间 Rn 或 其 一 部 分 , 先 验 分 布 互 及 Bayes 解 
5x 满足 如 下 的 条 件 : 
1" 对 任何 判决 函数 5, 8 的 风险 函数 RC5, 9) 是 9 的 连续 函 

2” 设 名 为 @ 中 的 任 - 一 点 ,So,《P) 为 以 bo 为 中 心 , 半 径 为 p> 
0 的 开 球 体 ， 则 对 任何 p>>0, 有 HH(8N So6,(p))>>0. 

3”6x 的 Bayes 风险 Ra(Sz) 有 限 . 
则 65 是 可 容许 的 . 

证 ” 若 不 然 ， 则 存在 判决 函数 6, 使 R(56, 0)<R(6n, 90) 对 一 
切 0EG9， 且 存在 boE@ 使 玉 (3a， 00) 一 R(5, 00o) 一 28>0. 因为 
R(6, 0), RBR(5g, 0) 都 是 0 的 连续 函数 ， 故 存在 p>>0， 使 当 DOE@ 
而 12 一 2o| <p(l0—0ol 是 0 和 0 两 点 的 欧 氏 距离 ) 时 有 Rl6a, 0) 
一 (5, 6) 之 e。 这 时 有 

Ra(8) ~| Rs, DAaH0) 


-| R(S, 9)d 互 (O) 十 | RC5, WAH OY). 


此 处 i 一 99 门 56.(p), 而 Gs 一 6 一 BQ， 因为 在 B11 上 有 BR(5g, 0 记 
R(5, 0) 十 8 而 在 B@s 上 有 R(x, 从 演 尼 (3 四 ,有 


Ra(8s)~|, BC8m 0) dH(0) -| R(8g, OAH (0) 


Je， 
+sH(ONS,(p)) +|, R(3, 0aH0) 


十 | R80) dH7(9)>> 人 Ba， ar 0) 
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~ Ry(8)-+eH(ONS,p)). 

由 于 s>0, H(8NS6(p))>0 且 Ra(5g) 达 2, 由 上 式 知 Ra(5x) 
> Ru(8)， 这 与 bg 为 先 验 分 布 吾 之 下 的 Bayes 解 矛盾 ， 因 而 证 
明了 本 定理 . : 

例如 , 考虑 例 5.21 中 的 Miniman 估计 (5.82)， 对 此 例 而 言 ， 
先 验 分 布 瑟 在 0<p<1 内 有 处 处 大 于 0 的 密度 , 故 条 件 2° 满足 ， 
条 件 8° 显然 满足 ， 至 于 条 件 1*， 只 须 注意 任 一 估计 量 3 有 风险 
函数 

RS, 2) =- 袜 [5(G) 一 可 5 jz 一 2 

它 显然 是 p 的 连续 函数 . 因此 定理 5.4 的 条 件 都 满足 ,而 Minimax 
估计 (5.32) 为 可 容许 的 ， 用 这 个 方法 不 能 证 明 常 见 估计 瑟 /n 的 
容许 性 ， 此 估计 确 是 可 容许 的 , 县 可 用 下 文 所 用 的 “0-R 不 等 式 
法 ”去 证 明之 . 

又 如 ， 设 和 Z，…,， 且 ~ 术 (9, 1), 一 0<9 之 oo0， 损 失 画 数 为 
(@ 一 们 3， 设 e 为 常数 , 0<c<1, 则 c 肝 是 98 的 可 容许 估计 ， 事 实 
上 , 取 先 验 分 布 9~ 困 (0, 7”), 其 中 改选 择 之 使 了 2 一 6， 则 由 
侧 5.2 和 例 5.18, 知 c 肝 是 此 先 验 分 布 之 下 的 Bayes 解 ， 不 难 验 
证 ， 定 理 5.4 的 条 件 1°~3° 都 满足 ， 条 件 1°、2° 显然 ， 对 条 件 
3°, 则 须 验 证 表达 式 


R(, 0 -seo 
xexp| 一 盏 宫 (0)? jao…am (5.38) 


当 RC6, 90) 处 处 有 限 ( 否 则 5 不 能 一 致 优 于 c 叉 ) 时 , 可 在 积分 号 下 
对 6 求 导 . 这 个 容易 的 细节 留 给 读者 . 

令 c>1， 则 得 ce 及 -> 储 . 于 是 立 是 容许 估计 的 极限 。 可 是 ， 
容许 估计 的 极限 不 见得 可 容许 , 故 这 样 还 不 能 证 明 闷 是 6 的 可 容 
许 估 计 ， 于 的 可 容许 性 也 不 能 由 定理 5.4 的 方法 直接 证 明 . 下 
面 的 方法 基于 0-B 不 等 式 ,由 它 可 以 处 理 有 关 单 参数 指数 族 的 参 
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数 在 平方 损失 之 下 的 某 些 容许 估计 问题 . 
现 设 8 为 9 的 任 一 估计 ,满足 条 件 


R(5，b)<< 有 (总 ,0 一 二 对 任何 实数 0 《5.39) 


记 如 (5(X， …， 总)) 一 9 上 09， 则 如 上 面 指出 的 , 3?(9) 存 在 , 
依 CO-B 不等式 , 有 
[i+ 6°(0)]2/w+6(0) <1/%,— 切 OE(—0%0, co)， (5.40) 
由 此 式 可 得 8(9) 委 -12210) 1=n/2>0. 有 5(6)/0*X(0)<< 一 1. 
由 (5.40) 式 知 &(O 生 0 对 一 切 9, 故 559) 为 处 处 非 增 的 ， 现 往 证 
5690) 之 0, 对 一 切 0， 不 然 的话 ， 存 在 名 使 5(0。o) < 过 0 由 非 增 性 ， 
知 5(9) 过 0, 当 0>0o， 故 由 2(0)/53(9)<< 一 1 知 , 当 9>> 名 时 有 
-10-00)>| 了 和 20- 了 8- 而 的 - (5.41) 
令 9->o0, 由 此 式 将 得 8(0) 一 0 这 与 5(0o)<0 且 2(9) 非 增 矛 
盾 . 由 此 知 5(9) 之 0, 对 一 切 0，、 现 有 两 个 情况 : 
1? 5(0)==0. 这 时 65 为 9 的 无 偏 估计 ,而 之 为 8 的 UMY UE, 
故 有 
‘R(8, 0)—Varo(8)>Varo( 2£)= R(X, 0). 
故 这 时 3 不一致 优 于 工 . 
2” 存在 bo 使 (bo)>0， 这 时 59) 关 久 bo >0, 当 0< 如 . 但 
当 0 一 一 co 时 ,500) 不 能 趋 于 2， 否 则 (5.40) 式 不 能 对 一 切 8 成 
立 .， 故 lim 58(9) 一 o, 0<o<co， 因 此 ,在 (5.44) 式 中 改名 为 6 一 


人 到 1 1 1 
从 — Y 二 一 一 一 -一 一 -一 一 一 一 一 3 
1, 表 令 0 一 一 cc， 将 得 一 ! 产 到 5 一 厅 B07 6 0， 这 是 


不 可 能 的 ， 因 此 当 (5.40) 成 立时 只 能 是 情况 1°, 而 一 致 优 于 蔡 的 
估计 5 不 存在 .这 证 明了 又 的 可 容许 性 . 

现 设 有 个 总 体 , 其 分 布 分 别 为 WO 1),…, Von 1). 从 
第 个 总 体 中 抽出 样本 从 ia， “0 人 NGCO 1), $=1,.…, Pp, 且 
设 合 样 本 下 ii， 生生， 全 体 独 立 ， 要 估计 仿 ， 
…，g5。 损 失 函 数 为 : 当 分 别 用 页 ，…,， d 估计 0，…， 2 时 , 损失 
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为 了 (Gd 的 (0 的) 六 人 一 908 一 个 自然 的 估计 
量 是 用 (Xi, 四 芯 中 估计 (0 "oy 0,), 其 中 T= Xn 这 个 


计 在 上 述 损失 函数 下 是 否 可 容许 ?由 于 p 一 1 时 我 们 已 见 到 回答 
是 肯定 的 , 因此, 自然 地 会 猜测 这 一 点 对 2>1 也 成 立 ， 可 是 不 然 ， 
对 2=-2 可 证 明 上 述 佑 计 确 为 容许 的 。 但 当 p 之 8 时 , 0. Stein 在 
1955 年 一 项 工作 中 , 出 人 意外 地 证 明了 上 述 佑 计 非 容许 ， 这 个 结 
果 引 起 了 广泛 的 兴趣 ,成 为 一 系列 研究 的 出 发 点 。 它 也 启示 我 们 : 
答 许 性 这 个 概念 是 一 个 很 复杂 的 东西 ， 


习 ”是 

1. 设 .ma 都 是 自然 数 ,m%<N。(a) 证 明 

BN mm 一 . 

BE 
(提示 : 把 X 十 1 个 球 自 左 至 右 排 成 一 列 , 编 上 号 卫 …， 术 +1， 从 中 选取 + 
工 个, 选 法 有 ( “| ) 种 \ 以 Ta<aa<…<sasN+D 计算 满足 条 件 oa 
一 二 了 的 选 法 .) (b) 利 用 (a) 解 下 述 问题 ; 设 祥 本 服从 超 几何 分 布 , Px(X 
-9 一 (0%)/(0) z=0, 4 …， 此 处 六 已 知 而 为 参数 . 设 
NL 的 先 验 分 布 为 


PCM=D)—— 


AVI 


4 一 0 1, .…, N. 


用 后 验 分 布 均值 估计 以 ， 证 明 此 估计 为 中 + 二 (3 二 一 1 

2. 设 1，…， Xn~(0, 0),9>0 为 参数 ， 设 6 的 先 验 分 布 为 BRC0,)， 
a> 0 已 知 ， 用 后 验 分 布 的 均值 估计 6. 

3， 设 1 …。X， 为 自 一 总 体 中 抽出 的 独立 随机 样本 , 总 体 密度 为 


6s 0 站 
1 0 一 避 “< 
=- ee<0<oo, 9 为 参数 ， 其 先 验 分 布 为 Cauchy 分 布 (有 密度 Fey ) 


求 98 的 广义 极 大 似 然 估 计 . 
4. 设 XX~N(9,，1)( 样 本 大 小 为 1 )，96 有 广义 先 验 密度 (0) =1 当 0>> 
241. 


0, (9) 一 0 当 6<0. 证 明 : 用 后 验 分 布 均 值 估计 9 的 结 困 为 有 1 十 e-X3/8 


/ 全 e200y. 

5.， (C8) 设 1， 让 ~ 和 NG 1 Ti Yn 和 (0, 1), 4, 为 参数 , 
又 合 样本 独立 , 而 (a, 5) 的 先 验 分 布 为 , 4, 5 独立 ;a~N Cp4, 7， Db~N (jg, 
区 .检验 假设 吾 ，a<b ce a>b、(b) 若 第 一 、 二 类 错误 的 损失 分 别 为 a 和 
co 解 上 述 问 题 . 
”6, 考虑 第 3 题 当 %= 工 的 情况 ， 并 将 9 的 先 验 密度 改 为 : h(6) 一 e™ 当 
0>0 =0 当 09<0， 检验 假设 H. 0 入 lc 天 ,0> 工 

7. 考虑 第 3 题 , 作 9 的 后 验 置信 度 为 1-a 的 最 短 区 间 估 计 . 

8. 设 X1 为 抽 自 指数 分 布 族 (1.8) 的 大 小 为 1 的 样本 , 而 9 有 广义 先 验 
密度 如 第 4 题 , 作 6 的 后 痊 置 信 妆 度 为 1 一 a 的 最 短 区 间 估 计 . 

9. 设 忌 ，…， 和 一 了 (91， 99) 组 << 扣 为 参数 。 (901, 的) 的 先 验 分 布 定 
义 为 : 01 有 指数 密度 ee( 当 全 > 0. 当 Bi 和 0 时 密度 为 从 ,而 在 已 知 负 时 ,二 
b 一 61 的 条 件 分 布 也 有 指数 密度 (e- 4 或 0, 视 和 > 0 或 E<0). 试 求 bw/4 的 
后 验 置信 度 为 1- a 的 最 短 区 闻 佑 计 . 

NN+2) (CN— 2 又 


10、 试 玉 第 工 题 的 估计 的 Bayes 风险 (结果 为 二 和 
计算 常用 估计 Nz/w 的 Bayes 风险 , 并 与 上 述 Bayes 风险 比较 谁 大 谁 小 . 
11., 设立 3 ”3 XN Cg, C2)， &, 2 为 参数 . 先 验 分 布 为 ; 375 有 指 


数 分 布 (1.8) 且 4 二 1， 而 在 给 定 o 时 ， 4 的 条 件 分 布 为 (0，zo2 ,5> 0 总 
知 , 要 作 a 的 区 闻 估 计 ， 且 规定 当 用 [e, 有 ] 去 估计 a 时, 损失 为 


2 当 g € Le, 0]; 


L(g, Oo, OD)=Y 7 
+m, 当 ae [ec， 中 . 


求 业 问 题 的 Bayes 解 ,并 考虑 当 > co 时 的 情况 . 

12. 设 寂 ~B(n,p). p 的 先 验 分 布 为 PCp 二 po) 二 PCp=1 一 po) =1/3,0 
<z<l/3， go 已 知 ， 又 损失 函数 定 为 (p 一 QO)?， 求 p 的 Bayes 估计 , 并 证 明 . 
可 适当 选择 po 使 此 Bayes 估 讨 为 p 的 Minimax 估计 ( 本 题 说 明了 (结合 例 ); 
Minimax 估计 可 以 由 截然 不 同 的 先 验 分 布 导 出 ， 且 不 同 的 先 验 分 布 可 产生 同 
一 Bayes 解 ). 

13. 设 Xi …， 和 了 BR(0, 9)，g> 0， 要 作 昌 的 点 估计， 损失 函数 定 为 


(6, 4) = (号 -1) 证明; 此 问题 在 变换 及 (=eX。 = 二， tc>0 之 下 
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为 同 变 ， 县 最 优 同 变 估 计 有 9n" ax XX 的 形状 ， gn 为 一 与 nn 有 关 的 消 数 . 找 
出 gn《 提 示 : 利用 max 又 为 充分 统计 量 )， 


坟 . 举例 说 明 ; 矩 估计 和 极 大 似 然 估计 都 可 以 是 不 可 容许 的 ， 

15. 设 1 …，Xn~ 术 (0, 1), 要 估计 9.， 损失 函数 为 (9 一 人 2 取 估 计 
量 纺 一 61X1 十 … 十 cn 了 Xn。 证 朋 : 若 4 十 … 十 Cn 二 1 则 除非 G1 二 … 二 en 一 4/ 
如 是 不 可 容许 的 ， 

16. 同上 题 。 以 ms 记 Xi，…， XX 的 样本 中 位 数 ， 证 明 ; mn 不 是 的 
可 容许 估计 ， 除 非 2<3( 提 示 :， ”mn 为 9 的 无 偏 估计 ， 而 对 为 唯一 的 
UMVUE). . 

17, 设 肝 为 自 入 (9, 起 中 抽出 的 样本 ，9 的 先 验 分 布 为 了 (0, 1)， 要 估 
计 6.。 损失 函数 定 为 了 (0,， 9) 一 es”4(9 一 Q)?，(a) 证 明 ， 在 后 验 风 险 最 小 的 
意义 下 ,6 二 2 革 是 唯一 的 Bayes 解 ，(b) 证 明 台 不 可 容许 (提示 ; 与 9*= 及 比 
较 ). 

18， 设 Xu …， 为 自 一 总 体 中 抽出 的 独立 随机 样本 ， 冲 体 密度 为 
fv, 9) 一 ee/0 当 z>0 Fo, 9)=0 当 z<0， 参数 0>0. 取 定 损失 函数 
《6- GD)2， 试 用 0-R 不 等 式 的 方法 , 证 明 驻 是 6 的 可 容许 估计 。 
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第 六 章 ”线性 统计 异型 


本 章 集 中 讨论 线性 统计 模型 ， 简 称 为 线性 模型 。 线性 模型 在 
数理 统计 的 理论 和 应 用 中 都 占据 十 分 重要 的 地 位 .尤其 在 应 用 统 
计 中 , 线性 模型 是 人 们 所 习惯 使 用 的 主要 模型 . 

线性 模型 之 所 以 有 广泛 应 用 ， 一 方面 是 因为 它 概括 了 一 大 类 
实际 统计 问题 , 另 一 方面 是 因为 它 结 构 简 单 , 处 理 比较 方便 , 从 而 
成 为 近似 地 处 理 其 它 类 问题 的 较 合适 的 模型 . 

如 果 从 上 世纪 初 Gauss(1809) 提 出 最 小 二 乘法 算 起 ， 线 性 模 
型 已 有 相当 悠久 的 历史 ,其 理论 也 有 了 广泛 深入 的 发 展 , 并 积累 了 
许多 行 之 有 效 的 方法 .因此 , 即使 服 于 这 个 方向 的 一 些 主 要 论题 ， 
如 回归 分 析 , 方 差分 析 , 都 已 有 不 少 篇 幅 浩 翰 的 专著 予以 阐述 ， 本 
章 所 涉及 的 只 能 是 这 个 方向 的 一 些 基本 概念 ， 基 础 理论 和 最 常用 
的 若干 方法 , 这 些 仅 是 线性 模型 的 入 门 知识 . 

章 和 下 一 章 将 较 多 地 使 用 抢 阵 工具 . 在 某 些 理论 探讨 中 ， 
矩阵 工具 是 必 不 可 缺 的 ， 在 许多 推导 和 计算 中 ， 它 将 带 来 很 大 方 
便 . 这 一 工具 已 越 来 越 为 实际 工作 者 所 熟悉 ， 本 书 所 用 到 的 矩阵 
和 线性 空间 的 基础 理论 ， 是 理工 科 各 系 的 高 等 数学 课程 中 已 经 讲 
授 过 的 。 由 于 统计 问题 的 特殊 性 , 要 用 的 有 些 结果 可 能 在 基础 课 
程 中 未 予 强调 ， 为 了 引用 和 参阅 的 方便 ,除了 众所周知 的 浅显 事 
实 外 ,我们 把 要 用 的 代数 结果 , 基本 上 不 加 证 明令 述 在 章 末 的 附录 
A 中， 


$ 6.1 线性 模型 的 概念 和 分 类 


“(一 ) 线 性 模型 的 概念 
一 个 实际 的 统计 问题 ,在 进行 数学 的 抽象 之 后 , 往往 可 以 归结 
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为 一 个 统计 模型 ?， 这 个 模型 一 般 地 说 , 无 非 是 联系 着 变量 (包括 
随机 变量 和 一 般 变 量 ) 和 参数 (已 知 的 和 未 知 的 ) 的 一 组 数学 关系 
式 ， 作 为 数学 对 象 的 模型 , 当然 不 可 能 、 也 不 必要 完全 等 同 于 具体 
现象 ,但 就 我 们 所 关心 的 那些 方面 而 言 , 它 应 当 能 在 一 定 的 意义 下 
有 效 地 反映 实际 的 统计 间 题 ， 尽管 在 建立 统计 模型 的 过 程 中 , 不 
免 要 涉及 统计 理论 ,但 建立 模型 并 不 是 统计 学 本 身 的 任务 ， 所 以 ， 
我 们 仅仅 在 必要 时 用 极 少 篇 幅 提 到 模型 的 由 来 ， 而 是 把 注意 力 集 
中 在 模型 的 分 析 和 处 理 上 . 
假若 我 们 要 考察 一 个 质点 从 时 刻 零 到 时 刻 + 所 走 过 的 距离 5. 
设 质点 作 勾 速 直线 运动 , 速度 为 B, 则 有 熟知 的 公式 s= Bt 作为 这 
一 现象 的 模型 。 一 般 认为 , 时间 十 在 一 次 观察 或 试验 中 是 可 以 精 
兢 测 定 或 严格 控制 的 ,不 具有 随机 性 ,我 们 称 这 类 变量 关 可 观察 的 
一 般 变量 ， 但 在 时 刻 t 要 测定 s 的 值 , 就 难免 出 现 测 量 误 差 , 于 是 
描述 上 面 现 象 的 比较 合理 的 模型 应 改 为 
s= Bi 8, (6.1) 


这 里 的 。 表示 测量 误差 . 测量 误差 的 取 值 是 随机 性 的 , 虽然 它 在 
每 次 测量 中 有 一 个 客观 值 ， 却 无 法 在 实际 中 确定 出 来 ， 这 一 类 量 
被 称 为 不 可 观察 的 随机 变量 . 此 时 也 是 随机 变量 ,但 在 试验 中 可 
测 得 它 的 取 值 , 称 之 为 可 观察 的 随机 变量 . 我 们 称 可 观察 的 随机 
变量 在 试验 或 观测 中 的 取 值 为 观察 值 。 B 是 一 个 未 知 参 数 ， 它 在 
模型 中 有 一 个 确定 的 未 知 值 . 

又 若 要 考察 两 个 随机 变量 了 和 六 的 统计 关系 ， 这 种 关系 一 
般 不 可 能 用 函数 关系 来 刻 划 , 但 在 了 给 定 的 条 件 下 ,了 与 于 的 统 
计 关 系 有 可 能 具有 (6. 切 的 形式 ， 这 在 后 面 要 讲 的 线性 回归 中 可 
以 看 出 . 

在 这 类 例子 和 设想 的 基础 上 , 抽象 出 线性 模型 的 概念 ， 

定义 6.1 设 了 是 可 观察 的 随机 变量 ,1,…, wm 是 可 观察 的 


1) 第 一 意 已 经 定义 了 统计 模型 。 这 里 将 着 重 探讨 其 中 具有 特殊 结构 的 某 一 类 ， 
即 均 信 有 线性 结构 或 属于 一 个 子 空间 的 那 一 类 ， 
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一 般 变量 , 81，…，A, 是 未 知 参 数 , s 是 不 可 观察 的 随机 变量 , 如 时 
它们 满足 


Y= fe …, wn) Bj 十 8， 所 是 已 知 函 数 ， (6.9) 


则 称 (6.2) 是 线性 统计 模型 "， 简 称 为 线性 模型 , (6.2) 中 的 。 被 称 
作 随 机 误差 , 一 般 总 假定 s 二 0, 这 是 对 线性 模型 的 最 少 假定 . 

按照 定义 ，(6.1) 当 然 是 线性 模型 ， 因 测量 误差 被 认为 服从 
NW(0,o7 分布。 并且, 如 设 质 点 改作 自由 落体 运动 , 那么 , 模型 就 
变 为 

s= Yi 二 8. (6 .8) 

这 里 7》 是 未 知 参数 。 由 于 (6.3) 对 参数 7 是 线性 的 ， 按 定义 6.1, 
它 也 是 线性 模型 ， 从 而 要 注意 , 线性 模型 的 线性 性 , 是 对 参数 Bs 
…， By 而 言 的 . 

在 线性 模 江 (6.2) 中 ， 不 妨 将 记 (za …，om] 改 记 为 2 j 一 4 
…, 2。 从 而 可 记 


之 fi ws, ~») zn) Bi wiBs. 
于 是 ,不 失 一 般 性 可 记 线 性 模型 为 


Y -TopBrts, 万 3 一 0. (6.4) 
或 者 用 均值 的 形式 来 表达 , 记 (6.4) 为 
EY = op (6.5) 


这 就 说 明 线 性 模型 无 非 是 一 个 随机 变量 其 均值 具有 来 知人 参数 的 线 
性 结构 的 统计 模型 ， 在 (6.4) 的 形式 下 , 模型 关于 w，…， ww9 也 是 
线性 的 ,但 就 定义 而 言 ,这 一 性 质 不 是 本 质 的 . : 

在 (6.5) 中 BY 是 ww1,…, 2 的 函数 ， 故 有 理 由 称 Wi, ***, Tp 
是 自 变 量 , 并 有 理由 借用 函数 关系 中 的 名 词 , 称 了 为 因 变 量 .， 当 
然 ， 我 们 不 应 把 这 里 了 和 m1,…, wy 的 统计 依赖 关系 和 函数 关 系 
相 混 请 , 这 里 不 存在 决定 性 的 因 采 关系 . 

1) 这 里 所 下 的 定义 是 狭义 的 , 但 就 本 书 而 言 是 基本 的 。 梢 后 可 在 到 其 推广 情 形 。 
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(6.1) 说 明 线性 模型 中 测量 误差 可 以 是 随机 误差 的 一 个 来 源 . 
然而 , 在 统计 问题 中 , 误差 的 另 一 个 来 源 很 值得 重视 , 就 其 意义 而 
言 ,或 许 更 为 重要 .让 我 们 来 解释 这 类 误差 是 如 何 引 入 模型 的 . 例 
如 要 预报 气温 .。 影响 气温 的 因素 很 多 ， 倘 车 把 影响 微弱 的 因素 也 
计算 在 内 ,不 妨 设 有 m 个 因素 , 记 为 mw …，zm。 假设 这 些 因素 对 
于 气温 了 的 影响 可 以 用 一 个 函数 来 表示 , 设 为 

Y=F(g, .…, tm). (6.6) 
但 从 实践 上 看 , 把 所 有 因素 全 考虑 在 内 , 或 者 根本 做 不 到 (如 未 认 
识 到 某 项 因素 对 了 是 否 有 影响 ), 或 者 因 花 费 太 大 不 值得 这 样 去 
做 , 还 可 能 因为 注意 了 细 枝 末 叶 反而 使 预报 的 效果 变 坏 , 所 以 , 常 
常 只 考虑 其 中 2 个 主要 因素 的 影响 (不妨 记 为 wz， …, wp), 而 把 次 
要 因素 的 影响 作为 不 可 观察 的 随机 变量 对 待 . 这 样 一 种 观点 ， 从 
数学 角度 去 看 , 似乎 很 不 严格 , 但 却 是 处 理 实际 问题 常用 的 办 法 ， 
至 于 所 得 模型 是 否 合用 , 尚 需 到 实践 中 去 检验 和 改进 。 在 上 述 观 
点 下 (6.6) 有 可 能 改 记 为 

Y=f(v, **, wp) 9 Vp+i, **°, Wm) ， (6.7) 

记 CR …, wm)。 不 失 一 般 性 , 仍 可 设 Bs 一 0. 这 是 因为 ， 
如 果 Bg(vpr1, ***, zm) 二 Bo 关 0， 则 可 记 6=—g(WVprl ,Wm) — Bo, 
而 在 前 一 项 fw1,…， zy) 中 加 上 Bo， 从 而 仍 使 Bs 一 0。 于 是 模型 

F=f(w1, *…, wp)+8 
中 的 误差 8 就 被 认为 来 源 于 方程 近似 ， 即 它 是 由 方程 不 能 精确 反 
瑞 实 际 问题 而 产生 的 . 

”在 实际 统计 问题 中 ， 两 类 来 源 的 误差 同时 出 现 的 情形 较为 常 
匈 ， 从 统计 理论 而 言 , 并 不 追究 误差 的 来 源 ,而 仅仅 对 它 的 分 布 特 
征 感 兴趣 , 如 它 的 分 布 类 型 , 均值 ,方差 , 以 及 各 次 观察 中 误差 是 否 
相互 独立 等 ， 在 后 面 的 进一步 讨论 中 ， 有 时 要 对 误差 作 进 一 步 假 
定 ， 诚 然 , 对 于 试验 工作 者 , 误差 来 源 可 能 是 很 重要 的 , 尤其 在 出 
现 系 统 误 差 ( 妃 s 关 0) 时 , 探究 误差 的 来 源 就 不 容 忽视 . 

在 对 模型 (6.4) 进 行 统计 推断 时 , 由 于 它 含有 Pp 个 未 知 参数 和 
误差 ， 常 常 需要 将 满足 这 一 模型 的 试验 ， 在 不 同 的 自 变 量 值 下 进 
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行 n 次 , 以 取得 足够 的 试验 数据 ， 这 里 的 试验 次 数 ww 一般 应 大 于 
Pp， 设 第 a 次 试验 中 自 变量 的 取 和 值 为 6 一 (zai, …, Xap) 。 称 wo 是 
一 个 试验 点 ， 注 意 , 我 们 用 w 这 个 角 标 专门 表示 试验 的 序 次 , 这 样 
可 避免 与 变量 的 序 次 指标 相 混淆 相应 的 因 变量 了 的 观察 值 记 
为 ys, a 一 1,…, wm。 从 而 有 样本 满足 的 模型 为 


了 
ya 一 2 VosBit a, Eea~=0, go=1, .…, %, (6.8) 
EI 、 


记 Y= 一 (za 有 一 0 *…, Po 
8 一 (61，…，8) ， 
(6.8) 可 简 记 为 
Y= 有 4B+e, Ee=0. (6.9) 

这 里 的 疏通 常 称 作 设 计 和 矩阵 ,y 为 观察 值 向 量 . 

在 一 些 教科 书 中 , 线性 模型 概念 就 是 直接 从 (6.9) 引 入 的 . 为 
区 别 起 见 , 我 们 可 称 (6.9) 为 样本 模型 。 今后 在 谈 到 线性 模型 时 ， 
我 们 将 更 多 地 从 (6.9) 出 发 ,概念 上 常 不 加 区 分 , 相信 不 会 引起 混 
消 . | 

在 具体 统计 问题 中 , 将 根据 精确 度 要 求 ( 在 一 定 的 概率 意义 下 
表述 ) 和 取样 所 必须 花费 的 代价 来 适当 地 选择 试验 次 数 %。 本 章 
将 限于 讨论 ”圈定 时 前 小 样本 理论 ， 线 性 模型 的 大 样本 理论 可 参 
看 陈 希 颖 《数理 统计 引 论 >. 


(二 ) 线 性 模型 的 分 类 

对 于 线性 模型 的 分 类 , 可 以 从 各 种 角度 进行 , 谈 不 上 有 很 严格 
的 标准 ， 一 种 分 类 是 从 试验 工作 者 的 角度 出 发 的 ， 以 模型 的 来 源 
和 要 解决 的 实际 问题 作为 分 类 的 标准 ; 另 一 种 从 统计 工作 者 出 发 ， 
则 以 模型 的 数学 特征 和 它 所 侧重 的 统计 问题 为 依据 ， 我们 倾 回 于 
后 一 种 ,并 遵循 已 经 形成 的 惯例 . 

让 我 们 从 日 变 量 的 性 质 谈 起 。 如 果 模 型 中 涉及 的 自 变 量 的 到 
值 是 长 度 、 时 间 、 体 积 、 重 量 这 一 类 可 以 连续 变化 的 量 , 我 们 称 这 类 
日 变量 所 代表 的 因子 (或 称 因 素 ) 为 数量 因子 ， 如 考虑 人 的 体重 对 
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于 身高 的 统计 依赖 , 这 里 身高 是 一 个 数量 因子 ， 在 另 一 些 统计 问 
题 中 ,如 农业 试验 , 要 考察 影响 小 去 产量 的 因子 ,如 土地 、 品 种 和 肥 
料 ， 土地 和 品种 是 按 某 一 块 、 荣 一 种 来 区 分 的 ， 不 是 连续 变化 的 
量 , 称 这 类 因子 为 属性 因子 。 这 类 因子 在 统计 中 使 用 时 需要 数量 
化 , 但 它 的 量 值 常 常 取 工 或 0, 表示 出 现 与 否 , 也 称 作 标号 (jabe]) 
变量 .实际 上 是 把 每 块 土地 , 每 个 品种 各 作为 一 个 因子 看 待 : 就 


”肥料 而 言 , 如果 只 考虑 种 类 的 区 别 , 当然 是 属性 关子， 但 若 感 兴趣 


于 施肥 量 , 似乎 是 一 个 数量 因子 了 .可 是 , 在 试验 中 , 不 可 能 让 施 
肥 量 连续 变化 去 考察 它 的 效应 ， 我 们 只 能 就 施肥 量 的 落 干 个 等 级 
来 考察 ,如 区 分 10 斤 .20 斤 .30 斤 三 个 等 级 ( 称 为 水 平 ), 实际 上 可 
以 用 三 个 标号 变量 来 刻 划 , 这 种 做 法 叫 作 将 数量 因子 属性 化 . 

根据 自 变量 因子 的 性 质 ,可 将 线性 模型 分 为 三 类 , 凡 自 变量 因 
子 都 是 数量 因子 , 就 称 这 个 模型 是 回归 分 析 模 型 ; 如 果 自 变量 因子 
均 为 属性 因子 ， 则 称 此 模型 为 方差 分 析 模 型 ; 倘若 自 变 量 因子 中 ， 
既 有 属性 因子 , 也 有 数量 因子 , 就 称 之 为 协 方差 分 析 模 型 ， 
” 另 一 各 公认 的 分 类 法 ， 超 出 了 我 们 对 线性 模型 所 下 的 狭义 定 
义 6.1， 它 的 依据 是 区 分 参数 B81, …，B 的 性 质 ， 从 某 种 意义 上 
说 Bj 反映 了 自 变量 的 第 j 个 因子 对 观察 值 y 的 影响 的 大 小 , 常 称 
之 为 第 j 个 因子 的 效应 . 这 个 效应 在 实际 问题 里 可 以 是 随机 的 ,于 
是 , 可 依 效 应 的 随机 与 否 来 分 类 : 如 果 B1, …， Bs 都 不 是 随机 变量 
而 是 固定 的 未 知 参数 , 则 称 模型 为 固定 效应 模型 ; 如 果 B1, …, Bs 
都 是 不 可 观察 的 随机 变量 ， 就 称 模型 为 随机 效应 模型 ; 当 Bi1,…， 
Bs 中 既 有 未 知 参 数 又 有 不 可 观察 的 随机 变量 ， 就 称 它 混合 效应 模 
型 ， 本 书 只 限于 讨论 国定 效应 模型 ， 随 机 效应 情形 的 讨论 可 参看 
有 关 线 性 模型 的 专著 . 

就 我 们 将 要 讨论 的 三 神 统 计 模型 来 说 所 侧重 的 统计 问题 是 
有 区 别 的 .回归 分 析 模 型 大 部 分 来 源 于 非 人 力 所 能 控 制 的 观测 ， 
它 的 主要 统计 问题 是 根据 已 得 的 数据 给 出 回归 方程 ， 其 主要 目的 
是 用 来 预测 (或 称 预 报 )。 方差 分 析 模 型 大 都 来 源 于 试验 , 一 般 是 
在 有 了 精心 的 设计 之 后 ， 它 的 主要 统计 问题 是 根据 数据 去 检验 因 
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子 效应 的 显著 性 ( 即 对 观察 值 的 影响 是 否 显著 )， 其 主要 目标 是 寻 
求 最 佳 试 验 点 。 协 方差 分 析 则 介 乎 其 中 。 然而, 根据 不 同 统计 问 
题 所 发 展 的 方法 , 往往 并 不 局 限于 原 模型 。 就 不 同类 的 模型 而 言 ， 
往往 也 有 本 质 上 完全 相同 的 统计 问题 . 即使 上 面 各 类 中 提出 的 主 
要 问题 , 也 可 从 理论 上 统一 处 理 。 下 面 我 们 先 分 节 讨论 针对 各 类 
模型 所 发 展 的 统计 分 析 方 法 ， 然 后 在 第 5 节 中 就 一 般 模 型 的 理论 
问题 作 一 些 探 讨 . 


$6.2 回归 分 析 


(一) 回归 的 概念 

回归 分 析 的 目的 是 寻求 一 个 随机 变量 ?了 对 一 组 随机 变量 
1 …， 斑 ps( 当 p=1, 就 是 一 个 随机 变量 ) 的 统计 依赖 关系 。 统计 
依 束 关系 不 再 是 单纯 的 因果 关系 ， 它 与 一 般 变 量 间 的 函数 关系 有 
本 质 不同 。 但 这 种 依赖 关系 是 在 一 定 的 统计 意义 下 确实 存在 的 ， 
我 们 将 逐步 明确 它 的 含义 ， 

回归 (regression ) 这 一 术语 是 1886 年 Galton 在 研究 遗传 现 
象 时 引进 的 、 他 发 现 . 虽然 高 个 子 的 先 代 会 有 高 个 子 的 后 代 , 但 后 
代 的 增高 并 不 与 先 代 的 增高 等 量 ， 他 称 这 一 现象 为 “向 平常 高 度 
的 回归 ”.。 尔后 , 他 的 朋友 区. Pearson 等 人 搜集 了 上 千 个 家 庭 成 
员 的 身高 数据 ， 分 析出 儿子 的 身高 y 和 父亲 的 身高 2 大致 可 归结 
为 以 下 关系 

yy 一 0.516z 二 833.73. 《以 英寸 为 单位 ) 

由 于 0.516=0.5， 意 味 着 如 父亲 身高 超过 父亲 平均 身高 6 英寸 ， 
则 其 儿子 的 身高 ,大 约 只 超过 儿子 平均 身高 3 英寸 ,可 见 有 向 平均 
值 返回 之 趋势 . 诚然 如 今 对 回归 这 一 概念 的 理解 并 不 是 Galton 
的 原意 , 但 这 一 名 词 却 一 直 沿 用 下 来 , 成 为 统计 中 最 常用 的 概念 之 


让 我 们 先 从 观察 值 出 发 来 讨论 ， 设 在 一 个 总 体 中 取得 某 个 样 
1》 在 允 元 统计 分 析 中 ， 将 把 这 里 的 一 个 随机 变量 推广 为 一 组 随机 变量 。 
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本 , 观察 它 的 两 个 特征 , 得 到 反映 这 两 个 特征 的 指标 (站 , 了) 的 观 
察 值 (zu %i)， 将 这 样 的 观察 进行 中 次， 获得 观察 值 (co ys), 0 一 
1,…, n， 从 而 得 到 平面 上 
n 个 点 ,如 图 6.1. 在 % 较 大 0 


的 情况 下 (nm 太 小 就 不 足 为 “一 
赁 ) ,如果 有 一 条 曲线 基本 上 oe 
大 部 分 偏离 曲线 不 远 ， 则 称 | 


这 条 曲线 是 对 观察 值 的 拟 合 一 一 一 一 
( 临 线 ) ， 如 果 这 条 曲线 的 方 国 0 
程 能 表 成 y 一 /Co)， 则 称 此 曲线 为 4 对 » 的 回归 曲线 ， 当 此 曲线 
是 直线 时 , 就 称 之 为 回归 直线 ， 这 暂且 还 是 一 个 很 粗糙 的 想法 ,但 
却 是 回归 概念 的 一 个 直观 的 出 发 点 。 

现在 我 们 从 理论 的 角度 予以 严格 讨论 ， 随 后 再 回 到 对 观察 值 
的 回归 分 析 上 来 ， 设 (全 , 了) 有 联合 概率 分 布 , 并 且 存 在 二 阶 矩 ， 
那么 , 当 了 取 某 个 特殊 值 > 时 ,7 虽 不 能 完全 确定 , 却 有 一 个 确定 
的 条 件 分 布 P(.|z), 从 而 有 一 个 确定 的 条 件 均值 (P| 区 是 x 的 
函数 。 将 函数 y 一 至 (了 |2) 的 图 象 表示 在 图 6.2 中 ， 图 中 曲线 (上 
线 的 ) 是 了 的 条 件 密度 的 示意 图 ， 意 味 着 了 按 此 分 布 散 布 在 曲线 
y 一 BT 1 的 上 下 ， 从 而 有 


y 


| -Ba 


定义 6.2 设 ( 且 ， 卫 ) 有 联合 概率 分 布 ， 如 果 对 四 的 每 一 给 
定 值 ,都 存在 了 的 条 件 期 望 ， 则 称 此 条 件 期 望 吾 (了 jw) 为 YY 对 
2 的 回归 函数 , 简称 为 回归 .， 当 及 是 一 维 的 , 称 作 一 元 回归 , 当 于 
是 p 维 向 量 , 就 称 为 p 元 回归 .y 一 BC(Y|w) 的 图 象 就 称 为 回归 则 
线 (当天 是 一 维 的 ) 或 回归 曲面 ( 当 下 是 多 维 的 ). 为 了 区 别 于 后 
面 将 要 引进 的 经 验 回归 ， 称 这 里 定义 的 回归 为 理论 回归 或 总 体 回 
归 ， 但 不 致 混淆 时 不 予 区 分 . 

回归 中 的 自 变量 脏 常 称 为 回归 因子 或 预报 因子 ， 回归 问题 
中 的 工 称 为 因 变量 , 回归 量 或 预报 量 、 了 在 试验 点 ww 的 值 是 随机 
变量 , 为 说 明 与 2 有关 可 记 为 了 。。 如 (Y 1w) 被 看 作对 了 了 。 的 一 个 
预报 ,有 时 用 记号 人防 . 一 如 (了 |w) 示 之 . 

在 回归 问题 中 , 视 了 和 于 的 地 位 是 不 对 称 的 .但 在 许多 情形 
下 , 这 可 能 是 人 为 的 处 理 ， 例 如 我 们 可 考虑 体重 对 身高 的 回归 , 也 
可 考虑 身高 对 体重 的 回归 .不 过 要 注意 这 样 所 得 的 两 条 回归 曲线 ， 
一 般 并 不 重合 可 参看 习题 6.7， 当然 了 和 于 地 位 不 对 称 的 情 
形 也 很 常见 , 譬如 我 们 不 能 作 父亲 身高 对 儿子 身高 的 回归 , 因为 说 
父亲 身高 统计 依赖 于 儿子 身高 显然 是 荡 雇 的 。 所 以 ， 在 实际 问题 
中 不 能 乱用 回归 方法 . 

现在 我 们 面临 一 个 必须 回答 的 理论 问题 , 将 吧 的 其 它 函数 ,如 
jw)， 看 作 了 对 下 的 “回归 ”( 理 解 为 对 工 。 的 预报 ) 是 否 有 可 能 
比 恕 (了 |w) 更 好 ?要 回答 议 个 问题 , 先 得 确定 一 个 好 坏 的 标准 ， 这 
当然 要 以 了 与 fw) 的 差距 来 衡量 ， 注意 到 样本 的 二 重 性 ( 它 也 
是 随机 变量 ), 我 们 可 以 用 均 方 误差 召 [ 了 一 了 (2)]? 作为 好 坏 的 标 
准 . 

定义 6.3 设 (了 , 下 ) 有 联合 分 布 且 存在 二 阶 和 矩 .如 果 政 ( 畦 ) 
满足 

BUY ~ MCI)]—minB[Y — fC (6.10) 
则 称 放 ( 畦 ) 为 对 了 的 最 小 均 方 误差 预测 . 
我 们 有 
定理 6.1 在 定义 6,3 的 条 件 下 , Z(Y | 了 革 ) 是 对 了 的 最 小 均 
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方 误差 预测 并且 ,在 了 的 一 切 预测 中 , 吾 ( 了 | 在) 与 王 的 相关 系 
数 达 到 极 大 值 , 这 个 极 大 值 是 
wV 万 (和 /VCZ)， (6.11) 
其 中 DCM) 是 了 天 ( 脐 ) 全 如 (了 | 于 ) 的 方差 . 
证 对 一 切 (可 测 ) 函 数 护 焉 ), 我们 有 
ELY—/(X)J’= EIY — BCY|A)+ECY|IX) f(A) 
~ BLY— BE(Y|X)]?+ BLE(Y|X) 
—f(X)]+28[Y ~ EB(Y|X)) LE(Y |X¥) 
—f(X)1. 
由 条 件 期 望 的 基本 性 质 可 得 
BE[Y— E(Y|X)] LE(Y |£¥)-f(X¥)] 
= HE{[Y — BE(Y |X)]LE(Y |X)—/(X)]IF¥} 
—E{[LE(Y|X)—/(X)I BR{[Y — E(Y |X)]|X}} 
一 0 
从 而 得 B[Y 一 了 (及 )]?>>B[Y 一 B(Y| 脏 )]?, 得 B(Y| 怪 ) 合 必 ( 罚 ) 
是 对 了 的 最 小 均 方 误差 预测 . 
容易 计算 . 
Cov(Y, f)=BE(Y — EY)[f(X)— Bf(¥)] 
HEI(Y— EY)[f(X)— Ef(X)]IX] 
= ELf(X)— EA(E)]LE(Y |X) — EY] 
=CoY(f, MUM). 
将 上 式 中 用 了 L 代入 可 得 Cov( 了 ,用 ) D(CM)， 根据 Bohwartz 
不 等 式 推出 相关 系数 间 的 关系 式 如 下 
. _ Cov(Y, f) _ Cov(W, f) 
pO, 1 VDCY DF) VDOY) DO 
VDCMIDCF) _ DOM) 
VDIYIDIf) VD(Y)DM) 
pF, M), 
定理 至 此 证 毕 ， 
‘253. 


由 定理 6.1 的 证 明 可 以 看 出 ,用 (CY |z) 来 预测 工 , 其 预测 误 
差 s 信 了 一 (了 |) 满足 
Ee=0, Die)=BEe?=D(Y )—D(M). 
引进 预测 精度 和 全 D(s)/D(Y), 有 
A=1—D(M)/D(YT)=1—po(Y, M). (6.12) 
可 见 预 测 精度 是 一 个 与 相关 系数 pt 了 , M) 紧 密 相 依 的 量 ， 在 统 
计 中 称 了 和 三 的 线性 函数 的 相关 系数 的 极 大 值 orz 为 二 和 下 
的 多 重 相 关系 数 .， 定理 6.1 表示 pz,x<<p( 了 了, WM). 
在 兰 给 定 w 的 条 件 下 , 记 相 应 的 了 为 Yo， 令 sc 全 了。 一 
BY |w), 有 轧 (eo{%w) 一 0. 于 是 有 
Y= BY I)+ 8. (6.13) 
称 (6.13) 为 回归 模型 ， 其 中 (了 |w) 称 为 回归 模型 的 主要 部 分 ， 
或 如 前 面 已 经 定义 的 叫 作 了 对 zw 的 回归 函数 . 
当 回 妇 BCY [2) 是 vw 的 线性 函数 , 即 
E(Y |%)= Bo Birit + Bow,, 
则 回归 模型 (6.18) 可 记 为 
Yom Bot Bvt :Tt Borpt er, (6.14) 
称 作 线性 回归 模型 >， 为 了 记号 上 的 方便 , 我 们 有 时 省 略 (6.14) 中 
作为 角 标 的 x, 但 此 时 不 能 再 把 xz1,…, zs 依 样 本 二 重 性 理解 为 随 
机 变量 , 我 们 已 把 它 作为 一 般 变量 对 待 . 在 这 一 理解 下 , (6.14) 如 
定义 6.1 所 述 是 一 个 线性 模型 ， 以 后 就 将 (6.14) 记 为 
上 一 Bo 十 ao 十 … 十 Bozo 十 3。 (6.14) 
然而 在 实际 问题 中 , 召 ( 了 |xw) 不 一 定 是 w 的 线性 函数 ,这 时 如 
人 为 地 用 z 的 线性 函数 去 预测 了 ,有 可 能 使 预测 精度 变 坏 ， 但 用 
线性 函数 作 预 测 自 有 它 简便 之 处 ， 况 且 下 面 关 于 正 态 总 体 的 一 个 
结果 表明 , 在 正 态 情形 下 , 限于 在 线性 范 数 类 中 选取 最 佳 预测 , 不 
会 有 任何 损失 ， 而 正 态 情形 无 疑 是 最 重要 的 情形 . 
1) 我 们 在 定义 6.1 中 给 出 的 线性 模型 的 定义 是 指 对 未 知 参数 线性 。 这 里 从 回归 


的 角度 强调 了 对 自 变量 的 线性 性 , 切 勿 与 原 概念 混 消 。 就 回归 而 言 非 线性 的 ， 
如 多 项 式 回归 , 仍 属 线性 模型 。 团 习题 1, 2。 
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设 z 一 (9%，zl， …, 2p) 遵从 wp 十 1 维 正 态 分 布 有 密度 函数 为 
f(2) = 25) dotV) 3 oxp{- 总 (一 oz 一 上 )|. 


记 | 机 用 Ey=08, Ex=~ Hk, 
v Vjp . 
则 记 允 的 边缘 密度 为 22 就 有 


E(Y |2)= | y(2m) (dety )* Yoxp{ 一 圭 (z- 的 


-jw ay 
将 QS(z 一 2)'V 2 一 切 依 9 重新 配方 得 
Q—(y -0)%u+2y -0 (wp)+ wp Vv—p) 
~ 二 [一 9+(09)-w(w 一 p)]*+o (e 不 依 弄 甸 )， 
从 而 可 知 了 的 条 件 密度 是 正 态 的 , 故 可 得 


E(Y |%)=0— (vi)-iy (gw- p) (6.15) 
是 m 的 线性 函数 " 


定义 6.4 设 ( 了 , 下) 有 联合 分 布 , 且 存 在 二 阶 甜 。 如 果 在 对 
的 线性 函数 类 {co+c'Z+ 中 好) 满足 
E[Y — Mw)l’= min ELY 一 cot- ewl|’ (6.16) 


则 称 至 (z) 是 对 六 的 最 小 均 方 误差 线性 预 测 . 
在 已 知 ( 了 , 2) 的 二 阶 矩 时 , (zw) 不 难 求 出 。 我们 有 
定理 6.2 
设 ( 了 , 下 ) 有 联合 分 布 ,其 协 方差 阵 
oo 人 (了 e610 
这 里 go 二 D (FY), oyx = Ory'= (Qov (了 了 ， 瑟 1)，…， Cov(T ， 
肝 p)), 2xx 一 Cov 脏 ， 则 有 了 的 最 小 均 方 误差 线性 预测 为 
M(g)— EY —oyxDrk E+orr2irT (6.18) 
证 设 w 的 任 一 线性 函数 为 co 十 cz， 我 们 有 
E(Y -co—cw)*=— BIHY— BEY)-c'(w— Er) 
+ (EY—oc—C Er)l? 
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一 0OY 二 CrYC 一 20yrrC 十 (再 了 一 oo 一 C Rr)’ 
Ot iyC— Sri orxy) (2rC 一 之 : i oxy) 
—OysSiroxr+ (EY —oo 一 CD) 
从 而 极 小 值 点 eco，c 是 方程 
(2 Dioxy=—0 
五 了 —co—-cEr=0 
的 解 。 易 见解 为 
C—Oi70xy, C08BY 一 vyx2xXBW。 证 毕 . 

由 附录 A. 5.2， 不 难 验证 在 联合 分 布 为 正 态 时 ， 由 (6.18) 给 
出 的 W4m) 与 (6.15) 中 的 加 (了 |w) 一 致 、 从 男 一 角度 看 , 这 种 一 
致 性 当然 已 经 由 定理 6.1 和 (6.15) 式 所 保证 . 

我 们 称 (6.18) 所 给 出 的 用 (ww) 为 了 对 的 线性 回归 .容易 
计算 它 对 了 的 预测 也 是 无 偏 的 , 其 预测 精度 为 

Nr=1—oyxDihorr/0S =1— p09x (6.19) 
和 一般 将 大 于 (6.12) 中 的 入. 

记 Bo 一 BY 一 oyz2wwBrx，B 一 2zz0xr， 得 总 体 线性 回归 模型 

为 


了 一 Bo 二 Bas ”| (6 .20) 
称 


y=Bot+B'w (6.21) 
为 回归 方程 . 《注意 这 里 % 是 函数 值 的 记号 , 不 要 混淆 为 二 的 观察 
值 .)B 称 作 回归 系数 . 
在 整个 这 一 段 中 ， 我 们 并 未 限制 目 变 量 w 的 性 质 ， 因 此 这 里 
所 讲 的 回归 模型 是 一 般 的 ， 它 与 第 一 节 所 定义 的 回归 分 析 模 型 略 
有 差别 . 


(二 ) 回 归 系 数 的 估计 与 经 验 回归 

在 总 体 线性 回归 方程 中 ,回归 系数 是 由 总 体 的 二 阶 乱 给 定 的 . 
但 在 实际 问题 中 , 二 阶 矩 一 般 是 未 知 的 , 要 用 取 自 总 体 的 样本 来 佑 
计 . 

设 容量 为 n 的 简单 随机 样本 记 为 


。 2056 。 


得 样本 模型 为 
\ 
v0)( 0 js (在 了 给 定 的 条 件 下 )， (6.22) 


现在 我 们 假定 (6.22) 是 一 个 回归 分 析 模 型 。 这 时 可 认为 设计 
矩阵 的 秩 rk(1 和 站) 一 p-+1。 这 是 因为 芷 的 元 素 是 容许 取 连 续 变 化 
的 值 的 ， 降 秩 的 情形 很 少 出 现 ， 在 理论 推导 中 就 不 顾及 这 种 例外 
了 。 如 采 在 实际 工作 中 遇 到 降 秩 情形 , 可 另 予 适当 处 理 . 
为 了 符号 简单 , 我们 改 记 
Z=(1X), 0=(BoB'), 
从 而 将 (6.22) 改 记 为 


y—2Z0+e (6.227) 
用 最 小 二 乘法 估计 9, 即 求 6 的 佑 计量 6 使 满足 
ly—z0l"—minly—20|: (6 .28) 


其 中 jel? 一 a'g 36? 表示 a 的 欧 氏 范 数 的 平方 ， 用 数学 分 析 的 
求 极 值 法 当然 不 难 给 出 (6.23) 的 解 。 但 我 们 宁可 用 代数 方法 去 求 
解 , 这 一 方法 称 作 平方 和 分 解法 , 它 在 以 后 还 会 经 常用 到 . 
假定 6 是 (6.28) 的 解 ,而 9 是 任意 的 , 我 们 有 
jg- z0)*=|y—20+2(0—0)l? 
=|y—201*+|z2(6-0)|"+2(6-0)z'(y—20). 

于 是 , 欲 使 
lg 一 z0 上 >>1g 一 z8l2 对 一 切 0ER?t! 成 立 
的 充 要 条 件 是 

(6- 0)'z'(y 一 20) 0 对 一 切 2ER2+ 成立. 
上 式 对 一 切 6 成 立 又 等 价 于 2'(y 一 26) 一 0, 即 

zz20=2'Yy (6.24) 

称 (6.24) 为 模型 (6.22) 的 正规 方程 。 它 的 解 


6 (2'2)-12'Yy (6.25) 
就 是 9 的 最 小 二 乘 估计 ， 记 下 = (BoB')', 就 得 到 Bo 和 B 的 估计 ， 
称 之 为 经 验 回归 系数 .相应 给 出 的 方程 
| j=Bt Bm (6 .26) 
称 作 了 对 w 的 经 验 回归 方程 、 称 记 十 局 w 为 经 验 回归 函数 . 
用 原来 的 数据 来 表 出 Bo 和 有 B. 在 p= 工 的 情形 下 计算 较 简单 ， 


1’ -1 n Doa\lt 
’ 于 -= 1 一 

(22) ( ) 四 | (2 3 

Sai Zw 
一 (mm 之 02 一 C22 | ” ) 
— ZH 1 
, 之 yu 
,~( 之 olja ) 
得 


Bo= (Bo23yo — Poa Tvoya) [3 一 (Zoo 
Pi = (atVabu 十 Wua23lo 7 [n2%a— (Zwa)"] . 
在 一 般 情形 下 , 有 


(§ /nm LX¥\:/1y 6 08) 
E)- (x x) (ro) OY 


具体 计算 较 繁 时 ,可 借助 计算 机 去 完成 . 

在 p=1 时 (6.27) 的 结果 ,与 在 总 体 线性 回归 (6.18) 中 用 样本 
矩 去 代替 总 体 矩 所 得 结果 完全 一 致 ， 其 实 , 对 于 一 般 的 p, 此 结论 
也 对 ,将 在 第 七 章 讨论 回归 时 论 及 . 

经 验 回归 方程 (6.26) 虽 然 得 来 容易 , 却 不 可 轻视 它 的 意义 .可 
以 说 它 概 括 了 历史 资料 所 提供 的 了 对 下 的 线性 统计 依赖 的 信息 
(当然 是 在 召 (Y | 下) 为 线性 或 接近 线性 的 前 提 下 )， 因此 , 用 让 = 
Btw 来 预测 了 在 新 的 试验 点 ez, 上 的 观察 值 y,, 似 不 会 有 过 
大 偏差 ， 这 种 预测 , 在 研讨 未 来 对 现在 的 依赖 关系 时 十 分 必要 ,如 
气象 .地 震 .洪水 的 预报 以 及 社会 .经 济 趋势 的 预测 等 ; 在 研究 对 象 
中 途 丢 失 或 数据 缺损 的 情况 下 ,y, 实际 上 变 得 不 可 观察 , 预测 当然 
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(6.27) 


不 可 缺少 ; 在 试验 或 观测 需要 耗费 过 大 时 ， 预 测 也 很 有 价值 。 然 
而 ,在 用 回归 方程 作 预 测 时 , 务必 相当 谨慎 .因为 模型 是 否 确 系 线 
性 , 因子 是 否 选 择 适 当 , 数据 是 否 充足 和 可 靠 , 都 是 值得 怀疑 的 .要 
取得 良好 的 预测 效果 , 还 需 依赖 对 于 实际 问题 的 具体 知识 , 

为 了 符号 上 的 简便 , 我 们 可 以 对 线性 回归 模型 作 合理 的 简化 ， 
一 种 办 法 是 引入 假 变 量 wo 令 其 在 各 次 试验 中 均 取 1， 从 而 不 认为 
回归 模型 有 特殊 的 常数 项 , 并 不 妨 把 至 仍 视 为 到 列 , 有 

2 一 Eee (6.29) 
另 一 办 法 是 作 数 据 变换 ， 因 回归 中 的 总 平均 Bo 不 过 反映 数据 计 
算 的 起 始 值 。 如 对 数据 作 变 换 ， 将 每 个 数据 减 去 它 所 在 列 的 数据 


平均 值 ， 即 Yays 二 ty， aj >tay 一 二 Hroy, j=1, 人 就 


以 每 列 的 平均 值 作为 新 的 计算 起 点 。 这 样 就 可 使 各 变量 的 样本 均 
值 为 零 ， 从 而 不 难 验 证 Bo 一 0。 只 和 需 注 意 在 用 新 的 回归 方程 y= 
pa 作 预 测 时 ,y、 zw 的 值 都 以 上 述 平 均值 为 起 始点 , 则 对 间 题 无 任 
何 实质 性 影响 ， 所 以 ,在 以 后 各 段 的 讨论 中 ， 除非 另 有 说 明 的 特殊 
情况 , 均 略 去 常数 项 . 


(三 ) 预 测 区 域 

上 段 所 讲 到 的 预 预测 是 没有 概率 保证 的 ， 即 我 们 无 法 回答 : 预测 
值 和 它 要 预测 的 对 象 吻 合 的 概率 是 多 少 ?这 种 情形 有 点 象 点 估计 ， 
现在 我 们 希望 能 用 样本 确定 一 个 区 域 , 使 得 它 包 含 待 预 测 的 y 的 
概率 不 低 于 某 个 被 称 为 置信 系数 的 值 1 一 x， 这 里 a 是 一 个 根据 
需要 选择 的 接近 于 零 的 正 数 (如 0.01 0.05 等 )， 这 就 是 预测 区 
域 问 题 . 

在 讨论 预测 区 域 时 , 我 们 必须 对 总 体 的 分 布 形式 作出 假定 , 否 
则 将 无 从 计算 概率 。 由 于 在 回归 模型 中 我 们 仅 涉 及 了 给 定时 了 
的 条 件 分 布 , 故 把 下 看 作 一 般 变量 ,， 谈 到 了 的 分 布 时 也 不 再 提 条 
件 二 字 . 我 们 仅 就 了 服从 正 态 分 布 的 情形 进行 讨论 , 且 设 各 次 试 
验 的 观察 值 是 互 不 相关 和 同方 差 中 的, 记 作 y~ N24B6, o 汪 ). 
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首先 在 上 述 分 布 假定 下 给 出 回归 中 涉及 的 并 将 在 预测 区 域 和 
下段 显著 性 检验 中 用 到 的 一 些 统计 量 的 分 布 , 

在 第 一 章 81.4 抽样 分 布 的 第 (三 ) 段 中， 我 们 已 经 给 出 本 音 
要 用 的 若干 分 布 及 其 基本 性 质 , 这 里 还 需要 作 些 补充 ， 

引 理 6.1 

设 了 Nm， 门 ， 4 是 呈 阶 对 称 阵 , 召 是 mxm 阶 阵 ， 则 有 

(i) 痰 4Y~x2(5)e> 4 是 对 称 短 等 阵 , 其 中 7 人 必 ，8 一 

pAn. 
(Qi) 当 YAY~x2(5), 
YAFS BY 独立 < B'A=0. 

证 我 们 只 证 两 个 命题 的 充分 性 , 而 把 必要 性 留 作 习 题 。 由 
于 4 是 对 称 宕 等 阵 ， 玉 4 亦 是 , 故 A+(T-A)~I, 和 且 rfAtrk 
(1 一 和 人) 一 nw， 故 由 Coohran 定理 中 (定理 1.2) 得 了 YA4Y~x:(5). 
(i) 的 充分 性 得 证 ， 因 (Gi) 中 设 YA4Y~x2(8), 知 4 为 对 称 知 等 
阵 , 存在 正 交 阵 加 使 vAv-(® 0) 记 Ua (UD, : Uy, U, 
是 mx 阶 阵 ， 令 了 一 UX, 则 有 

YAYF— XU AUR= 3:?, B'Y-B'UX. 
,, /I 0 

注意 到 B'4-B xln 0 
(B'U : B'Us)X=(0 : B'Us)X=B'UsX®, 这 里 着 一 ( 昼 p+2 
。 并 由 对 分 量 的 相互 独立 性 ,得 了 4 歼 与 盏 王 独 立 . 

记 司 = (瑟瑟 )-: 怠 区 是 回归 模型 (6.29) 中 有 的 最 小 二 乘 估 
计 , 称 lg -zwBls 为 剩余 平方 和 (或 称 残 差 平方 和 ), 记 为 S2， 易 见 

Sy Poy, 到 .一 了 一下 (站 下 )- 下 是 正 投影 阵 . 

而 9 人 下 BP,y, 这 里 P, 一 下 ( 玉 ' 耻 )-+ 主 ' 是 到 ( 昼 )( 玉 的 列 向 
量 张 成 的 线性 空间 ) 的 正 投影 阵 ， 于 是 有 

定理 6.3 

在 上 述 记 号 下 有 

1) Cochrar 定理 的 证 明 昔 洒 了 对 非 中 心情 形 的 结论 。. 
» 360 8 


jv- 0， 有 BU=0， 故 得 B'Y= 


B~N,(B, ol( XR)-Y), H~N,( EB, oP,), os yy, 
(6 .30) 
且 B. 参 和 独立 ， 其 中 力 是 设计 阵 及 的 列 数 . 
证 由 引 理 6.1， 只 需 注 意 到 (XB)'P, XB 二 0,， 且 rkP,= 
i 一 n 一 绪 半 (太太) 一 nn 一 1,( 大 ) + 玉 太 一 nn 一 p, 立 得 结论 ， 
需要 指出 的 是 这 里 外 的 协 方差 垂 阵 是 退化 的 ， 这 种 情形 下 多 元 正 
态 分 布 的 确切 含义 将 在 第 七 章 $7.1 中 给 出 , 故 这 里 的 结论 暂时 
还 有 一 定 模糊 性 ， 
设 在 历史 样本 的 基础 上 已 得 回归 方程 
$=2B 
设 新 的 试验 点 是 x 一 (ca …, wo) 。 为 求 g% 上 观察 值 办 的 预测 
区 域 ,需要 寻找 有 已 知 分 布 的 适当 的 统计 量 ( 它 应 当 含有 y,)， 因 
凡 wNirakB， 07) 令 让 一 wi 旭 一 w( 斑 ' 昼 )-! 玉 YW, 得 
Ye — Ye NI, Go#), 
因 y, 与 独立 ,因而 也 与 人 独立 , 故 其 中 
G3—02 二 owl( 导 及 )-Iw, 人 op, pl+ wm) -lm,. 


由 定理 6.3 知 o 58~ 允 -0, 且 访 与 yy- 名 独立 ， 故 有 
A VY, — Ys NO _ = 
TA Vw~P~ 科 -sp 《t- 分 布 ). (6.31) 
记 如 -zx(o) 是 分 布 如-s 的 上 侧 o 分 位 点 ， 即 刀 -s(0) 满 足 了 (了 了 
> co) 一 wx。 现 设 置信 系数 为 1 一 w 则 有 (|2| < 和 (名)) 
一 1 一 wx、 其 中 | 到 | < 委 志 - oe ) 委 js 价 于 


Ys — tp (&) Sep(m 一 D) cy 十 所。 ,(&)s sp(n—p) 于 ¥ 


记 上 面 不 等 式 的 左右 两 端 分 别 为 Yi 和 Ys， 遂 得 区 间 [y1，%aj 包 含 
y, 的 概率 P(y,E€ [yi, ya1)=1—a, 因此 ， yi, Ya 就 是 y, 的 置信 
系数 为 1 一 a 的 预测 区 间 . 

如 果 视 yi, ga 为 Ww 一 (2 22) 的 函数 ,那么 y 一 yi = ga 
就 是 RB?t! 中 的 两 个 曲面 。 这 两 个 曲面 所 夹 的 区 域 称 为 预测 带 , 图 
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6.3 中 画 出 了 w 为 一 维 时 的 预测 带 . 

同时 预测 在 mm 个 试验 点 w,= (zej) 上 的 观察 值 ,一 (yw 
ym )' 的 预测 区 域 ， 不 难 仿照 上 面 的 方法 的 原则 给 出 ， 此 时 办 = 
互 , 司 一 习 ,( 瑟 ' 互 )-1 瑟 9， 由 于 新 观察 值 V。 应 与 原 观 察 值 V 独立， 
得 g, 与 上 ,独立 ,有 

再 (g ,一 从) =0, Cov(y,—) =0°1n 0 是 (玉里) -1 


记 习 一 有 十 政 ,( 下 ' 下 ) 于 下 ， 它 当然 是 正定 阵 。 因为 c 翌 “(8， 
一 秒 ) 人 Nan(0， 1 )， 有 
0 一 (2 0.) 之- (9 ,一 #,) ~x3, 
因 g,, 多 , 都 与 8: 独立 ,我 们 有 
Fe (2 yy, — YD,) 和 一 吃 Dn np 


= 


2 
= 


EB 


记 mn-p(0) 为 Fnn-p 分 布 的 上 侧 a- 分 位 点 ， 就 有 
P((y,— 9) Dy, — 人 < SPnn_p(0)) 一 工 一 w。 


由 于 c(8) [Cg 一 思 ) 了 3 从 )<< 加 S32Pmwn A 是 
R" 中 的 棋 球 ， 得 cg) 是 /. 的 置信 系数 为 T-w 的 预测 区 域 ( 巴 
测 椭 球 ). 

现在 我 们 讨论 项 测 区 域 的 精度 问题 ， 讨 论 这 一 问题 的 必要 性 
是 明显 的 ， 如 果 巴 测 区 域 很 大 , 我 们 说 它 包含 了 y,, 实际 上 没有 什 
么 意义 , 并 不 能 使 我 们 对 % 有 比较 明确 的 认识 ， 我 们 希望 预测 区 
域 越 小 越 好 ， 遗憾 的 是 它 受到 各 方面 的 制约 ,不 能 随心 所 欲 ， 在 
m 一 1 时 , 预测 区 间 的 长 度 是 4 一 如 一 包 , 取 它 的 平方 得 


4 (ys—y) (hs)) 1+ oi),) np) -1 
不 难 算出 它 的 均值 是 
BA (bs)) or(1+ es( R'E),). 
它 显然 大 于 (去 全)) os， 泡 其 当下 下 有 很 小 的 特征 值 ， 县 %， 


a 2623。 


是 相应 于 它 的 特征 向 量 , 加 4? 可 以 很 大 .所 以 , 当 卫生 ( 称 为 信息 
和 矩阵) 有 很 小 的 特征 值 ( 即 它 接 近 于 退化 ) 时 ， 预 测 精度 可 能 极 低 ， 
这 时 的 信息 阵 王 ' 和 及 称 为 是 病态 的 , 它 带 来 很 多 麻烦 、 这 种 情形 下 
的 处 置办 法 已 有 人 作 过 很 多 讨论 ,不 在 此 介绍 . 


注意 到 且 二 BF 一 mospoo-at, 且 瑟 “ 的 特征 


值 小 于 1. 不 难 通过 较 细 致 的 计算 验证 它 的 预测 精度 将 低 于 mm 一 1 
情形 。 因 为 要 同时 预测 m 个 ， 
精度 的 降低 是 合乎 情理 的，m 
越 大 精度 月 然 就 越 低 . 一 一 一 一 一 Wi 
最 后 我 们 简略 地 介绍 一 个 
与 预测 相反 的 问题 称 作 控制 . 
它 研究 如 何 选 取 自 变量 的 变化 
范围 (控制 区 域 )， 使 得 以 一 定 
概率 保证 相应 的 观察 值 落 在 某 zig zw 一 
个 给 定 的 区 域内 . 在 p 一 1 时 ， 图 6.3 
我 们 可 从 图 6.3 中 的 预测 带 直观 地 给 出 解法 .如 和 欲 使 y 以 100(1 
一 o) 狗 的 概率 落 在 区 间 (%ao, yao) 之 内 ， 可 取 自 变量 控制 区 闻 为 
(wi0, X20o)， 在 此 不 给 号 更 细致 的 讨论 ， 


(中) 显著 性 检验 

前 面 我 们 已 经 讨论 了 从 样本 观察 值 出 发 给 出 线性 回归 和 预测 
的 方法 ， 尽 管 从 正规 方程 去 找 出 6 完全 可 以 在 形式 上 进行 , 但 所 
得 回归 函数 是 否 是 原 模型 的 主要 部 分 的 较 好 的 拟 合 ， 却 有 赖 于 对 
模型 的 基本 假定 , 即 它 是 一 个 了 对 w 的 线性 回归 模型. 

要 确认 模型 假定 的 合理 性 是 一 件 很 不 容易 的 事 ， 这 时 试验 工 
作者 的 实际 知识 往往 更 重要 ， 过 去 的 经 验 当然 也 有 助 于 我 们 作出 
抉择 ， 然 而 ,有 时 候 统计 工作 者 的 唯一 依据 就 是 一 批 数据 ， 那 么 ， 
单纯 从 这 批 数据 出 发 ， 有 什么 积极 办 法 去 检验 模型 假设 的 合理 性 
呢 ? 一 个 直观 的 办 法 就 是 去 考察 回归 直线 和 数据 的 拟 合 状况 ,但 这 
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个 方法 过 于 粗 蔬 .一 个 有 概率 依据 的 办 法 就 是 在 正 态 性 假定 下 进 


行 假设 检验 ， 
为 了 要 检验 模型 
y=1iBo+ B+e (6.32) 
的 合理 性 , 通常 提出 的 一 个 假设 是 
Ho:B=0 (6.33) 


如 果 五。 被 接受 , 就 有 理由 认为 了 对 wv 的 统计 依赖 是 线性 的 这 一 
假定 很 不 可 信 , 从 而 转向 考虑 另外 的 异型， 如 果 五 。 被 拒绝 , 虽然 
还 不 能 说 模型 一 定 是 线性 的 ,但 可 以 认为 了 与 w 毕竟 存在 某 种 程 
疼 的 相关 是 可 信和 的 , 从 而 增加 了 我 们 对 模型 的 信赖 程 度 . 即使 还 
谈 不 到 有 充分 的 理由 ,我 们 倾向 于 接受 模型 

为 检验 假设 五 。 我 们 要 构造 一 个 检验 统计 量 , 使 它 的 变化 能 
反映 五 。 成 立 与 否 ， 记 
Ss—minly -168— XBI’, SS—minly—1Bol?. 


Ss=|Paryl’=y Paryy. (6.34) 
容易 算出 z z 
Se=|Puyl?=y Pg. (6.85) 


在 及 ,成 立时 计算 55 的 均值 有 
EoSo= Eot Py =i PP Boyy’ =—t Pi [Covy + Boy( Boy )"] 
~ (%—1)o2 
在 瑞 。, 不 成 立 , 设 原 模型 为 真 时 ,计算 83 的 均值 得 
BiSo=(%—1)o*+|P¥Bl?> EoSs. 
因此 , 可 考虑 在 56 较 大 时 拒绝 五. 但 由 于 吕 的 分 布 是 cax2 1 含 
有 未 知 参数 , 不 能 作为 检验 统计 量 . 设想 用 铺 与 慰 之 比 消去 2， 
但 二 者 又 不 独立 .为 此 引进 回归 平方 和 5% 一 S83 一 8S2， 易 见 
SE 一 YPas 号)y0，( 根 据 附 录 A.6.5) 
因 至 十 避 ==5, 由 Cochran 定理 可 推出 
下 得 5 7Xa(3)， 7 六、 有 相互 独立 ， 
‘。 264:» 


Pe PP. C6.36) 


当 Ho 成 立时 
8 一 Bol (Paz — Pi)1Bo/o? = 
知 Fe~ Po,n_p-1. 

设 检 验 的 水 平 为 @，Fy,n-p-1(@) 是 Fy,n-p-+ 的 上 例 o- 分 位 点 ， 
则 检验 如 的 拒绝 域 是 
{FFp,n_p-1(0)}. “6.37) 

现 设 假设 (6.38) 已 被 拒绝 , 但 不 见得 6 的 分 量 全 不 为 零 、 我 
们 还 要 检验 因子 wi 的 效应 B, 的 显著 性 . 这 时 检验 零 假 设 

lo: B=0. (6.38) 
如 果 经 检验 瑟 o; 被 拒绝 , 则 称 因 子 wm 是 显著 的 ; 如 果 囊 o4 被 接受 ， 
因 了 于 就 可 在 模型 中 剔除 ， 故 称 这 样 的 检验 为 显著 性 检验 . 

为 了 以 下 讨论 的 简便 ,不 妨 假定 模型 是 没有 常数 项 的 ， 即 B。 
0。 此 时 回归 函数 为 
Yy—XB 《6.39) 
B=-(Z¥X) "XY, B=ei(KI) YY, 记 cS (XI)-+S (cw), 有 
Bi~N(B,, ocus)。 由 于 剩余 平方 各 Ss=y'Priy 与 应 独立 , 我 们 
可 令 

a 一 -Oo 中， 
当 及 om 成 立 ,有 
F~Fi,n_p, 
水 平 为 a 的 拒绝 域 是 
FFin pom), 
当 总 o 被 接受 ， 将 wm 的 数据 剔除 . 将 下 的 第 名 列 除 去 后 的 
矩阵 记 为 各 ,模型 就 变 为 
y=.B.te. 
需要 重新 估计 B,, 得 新 的 回归 范 数 ~ 
Y=A.pB,. 《6.40) 
不 难 证 明 , 记 B= (08 ”5 By, Biry, *"*, Bo)', 有 | 
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下 面 讨论 一 个 在 挑选 因子 时 容易 引起 误解 的 问题 ， 并 从 中 得 
出 很 有 意思 的 结论 . 
设 y, 等 适合 线性 回归 模型 
y=B-e, Ee=~0 (6.42) 
如 时 人 为 地 丢掉 (或 者 客观 上 存在 而 未 能 用 上 )(6.42) 中 的 一 部 分 “ 
回归 因子 , 不 妨 设 为 后 面 的 p 一 ? 个, 是 不 是 一 定 使 预测 的 效果 变 
坏 呢 ?回答 是 不 见得 变 坏 , 有 时 有 可 能 更 好 .让 我 们 以 在 新 的 试验 
点 完 上 的 预测 的 均 方 误差 为 标准 来 进行 讨论 ， 
将 筷 , B6, w 均 进 行 相应 的 剖 分 为 
rr Bw\ _{ To " 
(站 
在 原 模 型 下 得 到 的 了 的 预测 是 
一 B—(X'X) XYy. 
原 模型 又 可 改 记 为 
2 一 下 1B 十 下 Ga 是 1BO 十 8 (6.43) 
模型 (6.43) 中 的 Be, 实际 上 是 入 Bs, 但 在 丢掉 这 些 因子 时 ,就 数 
据 而 言 , 我 们 无 法 去 获知 它 的 实际 均值 , 并 且 在 对 (6.43) 用 最 小 二 
乘法 求 线性 回归 时 ， 与 &, 的 均值 并 无 关系 .于 是 得 了 在 模型 
(6.48) 下 的 预测 是 
从 -wipBo,, Bb, © .4 
设 两 种 情形 下 的 预测 误差 分 别 是 
EY —Y, &—Y—Y,. 
计算 均 方 误差 得 
Ea—D(E) =o(1+w( 居 ' 是 ) 1x), 
Eé:—D(é)+ (EEé,)? 
一 03(1 十 VD 及 1 有 1 20) 十 (五 怒放 ， 
注意 到 
BEé.=2'B— wu (1) 1 XB 
— TyBwt+ TipBo — Tu (1 ) 1 是 (B+ spB)) 
=Wlo)Boa) 一 C00( 闪 1 太 1) 1 三 1 让 Bo， 
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得 (BEé.)?= (mg — CR ) 0 ) Case : 
一 居 ; 太 (站 1 外) 下 0g). 
记 B&, 一 b 称 作 预测 偏差 .由 于 | 
, 及 1 下 在 1 到 sa 、 uiA Al Cl Cl13 
XXX zs a) ee 2 
由 附录 A.5.2 知 ，cii 一 (有 芷 1 用 1 ) “1 十 (下 1 宇和 下 1 本 sCao 生 2 生 1。 
〈《 生 (下 1) 1 Clip 一 一 ( 且 : 下 1) 1 且 1 下 ac。 从 而 得 
Dé)—D(é,)=o (ww — TR, A) m0) 
9 (和 54) 0 
一 0 人 一 0 0 ))j= 
( 娃 ( 吾 站 -1 第 1 是 sCoa 下 2 天 1( 下 1 征 1) 于 
一 Cap 悍 2 四 1( 四 1 下 1) 一 
(1) 1 Coo 和 
Coa 
- (下 1 是 1 下 1 大 3 ) 
I 
X Coa( 一 下 ?下 1( 下 1 四-17) 
一 O2(Wt 一 有 下 2 是 ( 旦 1 下 -CD) Coa Tg 
一 及 2 是 1( 生 1 且 1) 一 00D)。 


= oo 


一" ol 


Eé? — B= (Wo)—( 太 1 看 1) “1 是 1 有 6) (cscos 一 BBC) (Wo 

一 【再 1 且 让) 下 1 下 sa00))。 (6.44) 

注意 到 oscss 是 正定 阵 , 而 BoBe) 的 唯一 非 零 特征 值 是 YB”= 

El， 故 当 Be | 较 小 时 ,a?Cao 一 BowBiw 可 以 是 正定 阵 ， 此 
时 用 预测 了 不 如 用 加, 因为 B 名 > 了 B 癌 . 

寺 述 讨论 表明 当 一 些 因 子 的 效应 相当 小 时 ,将 它们 弃置 ,反而 

有 可 能 改善 预测 的 效果 ， 试 问 , 这 样 的 改善 从 何 而 来 ?9 不 是 了 的 

均 方 误差 最 小 的 预测 吗 ? 这 是 因为 模型 (6.43) 已 与 模型 (6.42) 不 

同 , 均 方 误差 最 小 是 在 模型 为 (6.42) 的 条 件 下 而 言 的 , 新 模型 下 
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的 预测 牺牲 了 无 偏 性 ,使 均 方 误差 中 出 现 5 这 一 项 , 但 却 使 误差 
的 方差 比 原 来 的 小 ,二 者 相抵 均 方 误差 有 可 能 比 原来 的 小 ， 当 然 ， 
上 上 述 讨 论 只 是 理论 性 的 , 因为 在 结果 中 含有 未 知 参 数 , 要 得 到 实际 
可 行 的 丢掉 因子 的 方法 , 尚 待 进一步 讨论 ,不 在 此 进行 . 


$6.3 方差 分 析 


(一 ) 基本 概念 

方差 分 析 是 分 析 试验 数据 时 最 常用 的 统计 方法 ， 

让 我 们 先 从 因子 试验 模型 谈 起 ， 设 在 试验 (或 能 控制 的 观测 ) 
中 ,我 们 感 兴趣 的 是 结果 中 某 个 能 观察 到 的 指标 y, 把 它 视 为 因 变 
量 ,而 影响 指标 y 取 值 的 试验 条 件 中 有 若干 个 因子 ， 记 为 Fy, …， 
Fp。 例如 我 们 感 兴趣 于 小 麦 的 亩 产量 , 而 影响 小 麦 亩 产 的 至 少 有 
土地 ( 记 为 责 ), 品 种 ( 记 为 Fs), 施 肥 量 ( 记 为 了) 等 等 因子 , 在 实 
际 试验 中 ,我 们 能 够 考察 的 只 能 是 有 限 种 不 同情 形 , 即 只 能 在 若干 
块 土地 ,若干 种 品种 和 若干 种 施肥 量 的 各 种 不 同 搭配 下 作 试验 . 设 
因子 在 试验 中 有 S, 种 不 同情 形 ,就 称 PF, 有 Bi 个 水 平 , 如 施肥 
量 分 10 斤 .20 斤 .30 斤 三 种 ,就 是 三 个 水 平 ， 在 因子 试验 模型 中 ， 
我 们 把 每 个 因子 的 每 个 水 平 各 看 作 一 个 自 变 量 ( 而 不 是 把 一 个 因 
子 看 成 一 个 自 变 量 ， 在 “因子 ”这 个 词 的 用 法 上 与 回归 分 析 模 型 有 
区 别 )， 这 是 一 个 标号 变量 ， 它 取 值 为 1 或 0， 如果 在 某 个 试验 点 
上 , 因子 的 第 了 个 水 平 被 使 用 , 则 与 之 相应 的 自 变量 就 取 值 为 
1 , 在 不 被 使 用 时 就 取 值 为 零 ， 于 是 ,在 这 个 模型 中 , 因子 代表 着 一 
组 有 特殊 联系 的 自 变量 (在 各 个 试验 点 上 , 这 组 自 变量 必 有 一 个 取 
值 1, 且 仅仅 有 一 个 取 值 1)， 与 自 变 量 相 应 的 那个 参数 , 因为 系数 
是 1， 代 表 了 自 变量 对 因 变 量 y 的 贡献 ， 称 作 该 自 变量 (也 就 是 某 
因子 的 某 个 水 平 ) 的 效应 ， 以 较 简 单 的 情形 为 例 , 设 土地 是 没有 区 
别 的 , 品种 具有 甲乙 两 种 ( 设 其 效应 分 别 为 Bi, Bs), 而 肥料 有 三 种 
水 平 ( 设 其 效应 分 别 为 71, ya， 7s), 则 蕊 每 释 水 平 措 配 各 作 一 次 斌 
验 的 模型 是 
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2 一 你 二 Bi4- Vit 81s Wa— Bot Bi ya B18 
Yi13™ 00t+ Bi-t Ya 818, 
Yai— Oot Bat Yi E14, Yaa =— ot Ba Ya E29, 
Ya3™ Oot Ba Ya-t 833. 
其 中 6。 是 代表 其 它 因 素 的 平均 效应 的 一 个 参数 ,用 和 窍 阵 记 法 有 


Yi11 1 10 1 0 0 to B11 
ia 1 1 0 0 1 0 Bi 81a 
yis | 1 10 0 0 1 Bs 818 
/ai 101100 Jy1 二 ga | 
Ya9 | 1 0 10 10 ya | Bn9 
Ya8 10 i100 1 Ts Bo28 
简 记 为 y= 和 490 十. (6.45) 


这 里 关于 模型 的 基本 假定 是 各 水 平 对 9 的 效应 是 可 加 的 ， 故 亦 称 
效应 可 加 模型 。 从 某 种 意义 上 来 说 , 它 比 回归 分 析 模 型 的 条 件 放 
宽 了 , 指 的 是 : 倘若 把 施肥 量 作为 一 个 回归 分 析 中 的 因子 看 待 , 把 
三 个 水 平 看 作 是 一 个 自 变量 z 的 三 个 取 值 ， 那 就 要 求 y 对 “线性 
相依 , 否则 就 不 能 写成 线性 模型 ,但 方差 分 析 模 型 中 把 它 看 成 三 个 
自 变量 , 就 不 存在 这 一 要 求 . 

在 分 析 因 子 试验 模型 时 ， 我 们 首先 希望 知道 一 个 因子 的 各 个 
水 平 效 应 是 否 相 同 。 如 果 相 同 , 说 明 这 个 因子 不 管 取 哪 种 水 平 对 
指标 无 不 同 影响 , 那么 , 这 个 因子 实际 上 无 关 紧 要 , 可 纳入 平均 效 
应 中 去 , 这 时 , 称 这 个 因子 是 不 显著 的 ; 如 果 一 个 因子 的 各 水 平 效 
应 有 不 同 , 则 称 此 因子 的 作用 是 显著 的 . 

方差 分 析 正 是 为 检验 因子 在 试验 中 作用 的 显著 性 而 引进 的 一 
种 方法 ， 它 最 早 是 由 及 . A. Fisher 于 1920 年 前 后 对 农业 试验 
作 统 计 分 析 时 引进 的 . 方差 分 析 的 概念 如 下 ; 设 在 % 个 试验 点 上 
作 了 试验 ,得 到 观察 值 向 量 y= (1,…, ys)'， 它 满足 一 个 线性 模 
型 多 一 了 B 十 se， 称 上 yl 一 YY 一 32 为 总 平方 和 ,如 果 |gyl 可 分 解 
为 一 些 韭 负 的 项 的 和 ,如 |y|?==35,, 而 这些 名 又 可 作出 明确 的 统 
计 解 释 , 那么 ,在 一 定 的 条 件 下 ,上述 分 解 式 可 用 来 进行 统计 推断 ， 
270 。 


则 称 此 分 解 为 方差 分 析 ， 一 般 来 说 就 是 将 198 他 分 解 为 一 些 二 次 
型 的 和 ， 如 果 其 中 某 个 二 次 型 恰好 反映 了 某 个 因子 对 [yl? 的 作 
用 , 就 有 可 能 在 一 定 条 件 下 用 来 检验 该 因子 作用 的 显著 人 性。 这 里 
的 “一 定 条 件 ”, 将 在 应 用 方差 分 析 时 予以 说 明 。Coobran 定理 ( 定 
理工 .2) 为 方差 分 析 提 供 了 理论 基础 . 在 实际 进行 方差 分 析 时 , 常 


常 是 将 [Poy| 一 3(ya- 双 * 进行 分 解 ， 这 里 3 一 工 半 wo。 由 于 


| 人 一 9 有 一 02 
对 上 |Pugl? 的 分 解 也 就 给 出 了 |yl? 的 分 解 ， 由 于 1 上 Pugyl’ 与 样 
本 方差 仅 差 一 个 常数 因子 , 这 大 概 是 称 此 分 解 为 方差 分 析 的 理由 . 
也 有 人 称 方差 分 析 为 离 差 平方 和 分 析 , 但 不 如 方差 分 析 简 略 . 

方差 分 析 方法 ， 自 然 适 用 于 一 切线 性 模型 ， 其 实 ， 我 们 在 上 
节 ( 四 ) 中 讨论 显著 性 检验 时 , 用 的 正 是 方差 分 析 法 。 但 在 方差 分 
析 模 型 中 ,由 于 所 关心 的 主要 问题 是 检验 因子 的 显著 性 , 寻求 最 佳 
试验 条 件 , 方 差分 析 的 作用 显得 更 为 突出 。 当 然 ,在 方差 分 析 模 型 
中 也 需要 估计 ,然而 此 时 的 设计 和 矩阵 常常 降 秩 , 在 处 理 时 还 要 引进 
一 些 概 念 和 技巧 , 故 留待 $5 中 去 讨论 。 对 于 方差 分 析 模 型 来 说 ， 
”试验 设计 问题 也 显示 了 它 的 重要 性 . 我 们 希望 能 精心 安排 试验 ， 
这 不 仅 有 减少 试验 次 数 、 节 省 支出 的 作用 , 也 是 为 了 对 数据 作出 明 
确 统 计 解释 的 需要 ， 甚 至 是 为 了 方差 分 析 的 可 行 性 也 必须 对 试验 
加 以 设计 .对 于 可 以 人 为 地 控制 的 试验 , 这 也 是 能 够 做 到 的 . 

前 面 所 谈 到 的 类 如 (6.45) 的 模型 ， 被 称 为 狭义 的 方差 分 析 模 
型 ， 本 节 将 限于 讨论 这 类 模型 中 的 一 些 不 算 复 杂 的 特例 ， 这 方面 
的 深入 讨论 可 参看 Scheffe 的 名 落 kThe Analysis of Varianoey: 

在 以 下 各 段 中 , 总 假定 模型 是 正 态 独立 同方 差 的 , 即 假定 8~ 
N.CO0, ol). 


(二 ) 单 向 分 类 模型 

单 向 分 类 模型 , 又 称 一 种 方式 分 组 模型 , 也 就 是 一 个 因子 的 试 
. 验 模 型. 它 是 方差 分 析 模 型 中 最 简单 的 一 种 , 它 就 是 按 因 子 的 7 个 
。 371« 


水 平 将 观察 值 分 为 了 个 组 , 记 为 

Y= Ya Ym rr S YY). 
其 中 第 i 组 yw 是 试验 取 第 个 水 平 进行 时 得 到 的 观察 值 向 量 , i 
是 在 第 5 个 水 平 上 试验 的 重复 次 数 ，% 一 1，…, 9。 改称 作 一 种 方 
武 分 组 数据 模型 , 其 具体 结构 为 

Ym = Bot Bit Bm; o=1, 0 Fy hi=, ,Wy Pim = n. 

i (6.46) 
根据 方差 分 析 的 思想 ， 将 观察 值 向 量 9 的 总 的 离 差 平 方 和 SS 全 
习习 (ou 一 下" 进行 分 解 ， 以 后 ， 凡 甩 5 惫 表示 贡 的 分 量 的 总 平 
均 ， 即 把 所 有 观察 值 加 起 来 ,， 除 以 试验 总 次 数 、 而 用 %. 表示 将 观 
察 值 按照 ”、 全 可 和 然后 除 以 这 个 角 标 的 取 值 个 


数 ， 即 有 9 yi 六 Yip,, 
对 0m 9)? 用 平方 和 分 解法 得 
se 人 Ym — 9) 一 > 之 (yw 一 9 + gs. 一 细 )? 
2 Ym + 罗 轩 G1-D yg) (6.47) 
上 式 第 二 个 等 号 成 立 -是 因为 交叉 项 
人 Ym yi. ) (gs. —y)= 一 之 [ge —9) Sym ye)] 一 0. 
证 Se 一 之 之 (ye 一 9. 2, SS 一 之 名 (和 本 "mY 一 乡 )2， 
则 有 . SSr= 8S SS,. 
注意 到 SS.= LP yl? ， 出 引 理 6.1 知 SSr/o?~x-1 相仿 ， 
因 SLi — Yi.) ”= TB, yl?, 得 ol Py | 一 zx- 且 由 [Pi yl ， 
i 一 1，…, 7 之 间 的 相 瑟 独立 性 ， 内 Cochran 定理 的 系 推出 
0 3SSeo~xa-r， 于 是 ,根据 ( 非 中 心情 形 的 )Cochran 定理 立 得 
SSy/o?~vxr_13， 这 里 个 一 ] 记 ,By?/o?.。Coohran 定理 同时 断言 
了 S85 与 SS; 是 独立 的 ,从 而 在 


1 人 SNS, 名 一 全 
“ SS, 7—1 


1 
加 果 Bi=:**=B,, Ys Yj: 其 至 y 似 应 无 显著 差异 ， 而 当 RB;* 
ao73。 
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B, WW Cg. 一 2)2， (ys. y)? 均 会 明显 增加 ， 因 玮 SSr— Sly —Y)” 


是 各 类 效应 (6:, …,， 6,) 之 间 差 异 程度 的 衡量 ， 当 B41 一 … 一 Br 不 
成 立 ，SS, 将 偏 大 (严格 论证 可 仿 8 6.2( 四 ))。 且 在 B: 一 … 一 ， 
时 易 见 8 一 0， 故 (6.48) 中 五 可 用 作 检 验 假设 
Ho:Bi=:……=B, 
的 检验 统计 量 。 如 果 要 求 检验 的 水 平 为 w, 则 取 拒 绝 域 为 
{F> F100)}. (6.49) 
当 由 观察 值 计算 所 得 丈 属 此 拒绝 减 , 则 否定 Ho 假设 , 认为 试验 中 
所 考察 的 因子 是 显著 的 .， 否 则 就 认为 此 因子 是 不 显著 的 . 
实际 上 这 个 检验 问题 与 $6.2( 四 ) 中 检验 回归 模型 的 假设 检 
验 完 全 一 致 ， 不 过 这 里 是 用 典型 的 方差 分 析 方 法 来 讨论 的 . 因 设 
” 计 阵 是 0 一 1 阵 , 这 里 的 计算 要 简单 得 多 . 
在 具体 进行 时 ,把 计算 结果 盾 入 下 面 格式 的 方 关 分 析 表 中 ,使 
方差 分 析 成 为 一 项 很 容易 进行 的 工作 . 


表 6.1 单 问 分 类 方差 分 析 表 


平方 和 来 源 平 方 和 自由 度 | 平均 平方 和 


eee— ee—— 


类 间 B88 = nays 一 切 ? 


误 差 


SSe 一 它 : > Cake Ys)3 


总 计 SSr— » > (Yawe™—)?. 


t=l1 k= 


(三 ) 两 向 分 类 模型 


两 向 分 类 模型 也 称 两 种 方式 分 组 模型 ， 它 相当 于 一 个 两 因子 
试验 模型 。(6.45) 就 是 一 个 例子 ， 既 可 按 数据 所 对 应 的 第 一 个 因 
子 的 两 个 水 平 中 的 每 一 个 而 分 为 两 类 ， 又 可 按 数据 所 对 应 的 第 二 
个 因子 的 三 个 水 平 中 的 每 一 个 而 分 为 三 类 ， 一 个 直观 的 想法 就 是 
将 数据 设想 为 矩阵 形式 
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(* Yi19 0 
Ya1 ?oa Yag 
那么 按 行 分 可 分 为 两 行 , 按 列 分 可 分 为 三 列 , 行 . 列 各 算 一 向 ,就 是 
两 向 分 类 . 这 样 的 分 法 当然 并 非 任意 , 而 是 由 模型 的 结构 所 决定 
的 . 一 般 地 有 
yy— Ot Bt yt ey d=1, ee, ;j=—1, + 6. (6.50) 
即 按 行 分 有 7 类 , 按 列 分 有 c 类 ， 称 ys 是 在 (2 力 格 中 的 . (6.50) 
是 每 格 只 做 一 次 试验 的 两 向 分 类 模型 。 根据 需要 , 各 格 中 可 做 重 
复试 验 ， 如 果 各 格 中 重复 试验 次 数 相 等 ,就 称 这 个 模型 是 均衡 的 ; 
否则 就 称 为 不 均衡 的 ， 另 外 , 由 于 有 两 个 因子 存在 ,除了 各 个 因子 
单独 对 试验 结果 起 作用 外 ,还 可 能 存在 两 个 因子 的 综合 作用 ,这 种 
作用 称 为 交互 作用 , 这 时 模型 中 将 出 现 交 互 效应 项 . 这 种 情况 下 
称 因 子 水 平 的 单独 的 效应 为 主 效应 (6.50) 就 是 均衡 的 没有 交互 
作用 的 最 简单 的 两 向 分 类 模型 . 
上 述 讨论 很 容易 推广 到 多 向 分 类 模型 ， 那 时 可 把 数据 设想 为 
多 维 空间 的 一 个 阵列 . 
下 面 由 简 到 繁 地 讨论 儿 种 常见 情形 ， 
i. 每 格 中 只 有 一 个 试验 ”模型 如 (6.50)， 要 检验 的 假设 是 
Ho Ba 一 一， 
或 者 是 
Ho Ti 一 … 一 7o， 
目的 就 是 要 检验 行 因子 或 列 因 子 (不 妨 如 此 称呼 ) 的 显著 性 . 


念 (二) 中 用 过 的 符号 , 且 记 了 = 革 加 yw， 可 作 如 下 的 离 关 
平方 和 分 解 
S57 一 宛 闻 (yy~—Y)” 
-之 之 (Yi 一 名. 一 9 十 9 十 入 .一 2 十 一切 
np HCC mE -yt y+ oy. -y+ 
SS, SS SNS. 
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由 (二 ) 中 讨论 知 
SSr/o~ Xro1,8, SS,/o ~ X21,8,, S'S/ oT ~ x 4,3 
且 痛 
0 DF By Ey) DH -atp— Bb)’ 
-BD tr 8B) 02 82). 
因此 有 SS/g"~xsa_r-ori 并 且 与 SS,, SS。 相 瑟 独立， 从 而 可 得 
当 Ho 成 立 ， S67=0, SSr/o ~ Xr_1 故 有 


» ,网 一 个 一 0 十 


可 取 检 验 五 o 的 拒绝 域 为 {Fi Firo_r-ori(0)}. 这 里 wx 是 检验 
水 平 . 
当 Ho 成 立 ， 32: 一 0， SSo/ 0 ~ Xe, 故 有 


SH, CC— 人 个 一 1 
Paar Po srorort. 


可 取 检 验 总 oa 的 拒绝 域 为 {Fa 之 Fo_i,ro-r-ori(0)}. 

习惯 上 称 SS; 是 行 因 子 引 起 的 ( 离 差 ) 平 方 和 ，SS。 是 列 因子 
引起 的 ( 离 差 ) 平 方 和 . 称 5S3。 为 误差 平方 和 ,在 计算 时 它 可 由 SSz 
一 -一 29。 而 得 ， 方差 分 析 表 如 下 : 


表 4.2 西向 分 类 (每 略 一 个 试验 7 方差 分析 表 


平方 和 来 源 平方 和 自由 度 均 方 8 值 
行 因子 | BSGD? | rl | 688/71 | FD 
列 因子 | S88s=7 字 (9 办 ? cl SS,/c—1 有 一 号 (于 


RS 一 SSzr 一 SS 一 S83。 tr —1) Cc—1) 人 


总 计 | re—1 


2. 每 格 中 有 Pp 个 试验 情形 ”现在 讨论 两 因子 试验 有 交互 作 
用 模型 
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Yimn—= Oo0t Bit+ yit (BBY) Bim, 
=1, 0 TF, j=1, 0, C0, KF=1, ,Dp, (6.51) 

这 里 8，? 的 意义 同 (6.50), (By)w 表示 行 因子 的 第 i 个 水 平 与 
列 因 子 的 第 个 水 平 的 交互 效应 ， 这 时 要 检验 的 假设 除 工 中 已 讨 
论 过 的 五, 总 oa 外 , 尚 有 

妃 oa: 087)5 对 一 切 (%, 力 均 相同 。 
如 果 互 oa 变 接 受 ， 认 为 行 、 列 因子 的 交互 作用 是 不 显 蓝 的 (可 不 予 
考虑 ) 如 果 拒 绝 互 os, 则 表明 交互 作用 显著 ,这 时 要 推断 哪 种 水 邓 
搭配 最 佳 , 就 要 把 交互 效应 考虑 在 内 . 

这 时 的 方差 分 析 可 仿 ( 一 ) 与 (二 1L. 进行 ， 有 
之 字 之 (yin 9)"— DB 之 之 (Yim — 4) + Spys. -9)? 
S88,+8S,， 其 中 加. 一 二 加 
这 里 SS,= EY p(yy. —9)? 表示 各 格 间 的 离 差 平方 和 记 Yi.. = 
启 之 之 Vip, Ys - 访 之 之 Wi 又 有 
So 一 之 DS Py 一 给- 一 9 十 站 十 如 pei.. — 9 + Dipr Cy 一 2 
人 SS SS,+ SNS,. 

于 是 有 总 平方 和 

SSr=SS,+SSt SS.+-SS, (6.52) 
显然 有 SSr/o?~xtep-16; SSs 是 由 重复 试验 的 误差 引起 的 ， 称 
误差 平方 和 ， 有 BS5。/o*~x2w-y; SS8,/0? ~ x3_im, SSo/o?~ 
-1,0w 分 别 由 行 因子 和 列 因子 引起 ; SS,。 一 SS 一 S88, 一 SSo, 它 是 
格 间 平方 和 减 去 行 . 列 因子 引起 的 平方 和 ,被 认为 是 由 交互 作用 引 
起 的 ,有 SBro/0 ~ Xr yD,, 并 且 (6.52) 中 右边 四 个 平方 和 是 
相互 独立 的 . 

仿 工 知 ,检验 假设 Hol, 玉 0g 的 统计 量 分 别 是 


~ SS .rep—1) So。 re(p—1) 
fi 人 SS, rT: Fa SS coc—1 7 


拒绝 域 分 别 是 
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{Fi ,rotp1) (0)} > {Fs Fy, re(p—1) (0)}. 

从 统计 直观 来 讲 , SS, 表示 格 间 的 差异 , 如 果 交 互 作用 不 显著 
(Hos 成 立 ), 它 单纯 由 观察 值 的 随机 性 及 行 、 列 因子 效应 所 引起 ， 
应 当 比 交互 作用 显 鞭 时 ( 互 os 不 成 立 ) 要 小 , 故 下 og 不 成 立时 , SS, 
' 贿 之 又 有 SS-。 有 偏 大 的 趋向 ，( 它 的 严格 证 明 请 看 86.5( 四 ) 的 
引 理 6.4) 从 而 得 检验 Hos 的 统计 量 为 


NS。 一 荆 
Fs 会 8S, 1 ~ Foro (人 一 二 637 


这 里 级 ~ 避 思 PCB94. 一 By 一 B94+ 丈 )?/o?。 当 Hum 成立 有 
器 一 0。 因 此 , 水平 为 “的 拒绝 域 为 


{Fs> Fr-Deo-D,rop-b 0) } 。 


表 4.3 两 向 分 类 (均衡 情形 ) 方 差分 析 表 


来 名 平方 和 自由 度 均 方 ? 值 
行 因子 名: 一 cp 双人 (和 一 芒 ? | rl BSr/r—1 Tg 


列 因子 | 58。 一 ?p(y. 一 只? c—1 SSo/c—1 Po Re ep 


Se c—1 


交 互 SS 一 SS 一 gg | 1) (Cc—1) Sre/ SB8re . 7c (Pp—1) 
作 用 | 全 S33 (r=1) (cD)| fF- 55。 tie 


格 间 jS8,=p 忆 字 (Var 一 9 ?0 


BBSe/ 


“PY | re (wp—1) 


SS 一 SS8r -SS， 


Sr _ 
一 之 之 PA .rcp—l1 


3. 各 格 中 试验 数 不 全 相等 ( 非 均衡 情形 ) ”考虑 模型 
Yin— Oo0t Bt Yt (BY) yt em, {6.583) 
其 中 心 一 二 和 j 了 一 1，，…*, 0; 而 的 取 值 是 依赖 于 和 霹 少 的 , 有 有 一 
EFC, )) =1, ee, ng 
困 各 格 中 试验 数 不 全 相等 ，2 . 中 方差 分 析 法 无 法 直接 搬 用， 
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这 时 要 用 附加 约束 法 (或 称 边界 条 件 法 )、 附 加 约束 法 的 可 行 性 
将 在 86.5( 二 ) 的 定理 6.8 中 给 出 ， 我 们 对 (6.53) 附 加 以 下 的 
束 
之 mp 一 0， Dn =0, mtBY)y 一 瘦 ny(B7)y=0, 
(6.54) 
这 里 9 一 部 Ny 2 一 之 ej, 
设 要 检验 的 假设 五 o, 互 o, 吾 0s 如 2. 中 给 出 , 分 别 用 以 检验 
行 因子 作用 、 列 因子 作用 和 交互 作用 的 显著 人 性。 因 附 加 了 约束 
(6.54), 这 些 假设 应 表述 为 
Ho: Bi=:=B:=0; 
Hos: Yi1=*"*=7y=0; 
Hos. (BY)i=*… = (BY) = 0. 
用 类 似 § .6.2( 四 ) 中 方法 去 导出 检验 统计 量 ， 上 先 计算 SS,= 
min [yn Oo Bi yi- (BY)u]’, 我 们 注意 到 在 约束 


CG .54) 
(6.54) 下 误差 平方 和 可 分 解 为 
Dymo Bi—Ys— (BY7) 1]” 
= 之 之 Dyin— yy ty — Oo ty.. 一 9 一 局 ;十 Ys. —y— 74 十 gj， 一 乡 .. 
一 Yj. 十 9 一 (B87)41 = LY Ye) +t yO0)? 
+ (ge —y— B+ YY 7 Vy — Ye — Yj. 
+y—(B7))]. (6.55) 
(在 约束 (6.54) 下 交叉 项 全 为 0. ) 于 是 得 
SS 一 也 mY) 
在 假设 互 u 及 约束 (6.54) 下 求 上 述 误差 平方 和 的 极 小 值 ， 可 通过 
在 (6.55) 中 取 6 一 0 而 得 
So 一 之 yin) + 之 AGT 。 De 
二 SS 一 习 w. (入 .一 纺 2 有 检验 ot 的 统计 量 为 


。 218. 


Pie "人 ， 其 中 一 卫 nw 


相仿 可 得 SS 一 好 mV.4. 一 下”, 有 检验 Ho 的 统计 最 为 
SS。 n—re 
| SS c—l1" 
记 S'Syo 一 之 了 na (Ys. —%.. — gy)?, 有 检验 Hos 的 统计 量 为 
人 人 9- ， %— TC 
CE 
其 余 讨论 与 2. 完全 相仿 。 方差 分析 表 也 不 再 另外 给 出 . 
本 有 段 中 所 讨论 的 模型 和 方差 分 析 法 ， 可 推广 到 多 因子 试验 情 
形 而 没有 任何 原则 性 困难 , 但 随 着 因子 数 的 增加 , 其 复杂 程度 将 明 
显 增加 ， 


fa 全 


$6.4 协 方差 分 析 


(一 ) 模 型 和 统计 背景 
协 方差 分 析 是 组 合 方 差分 析 和 回归 分 析 的 特征 而 形成 的 一 种 
统计 方法 ， 从 它 所 处 理 的 模型 来 看 , 其 主要 成 分 由 两 部 分 构成 , 如 
2 一 下 1B 十 下 sy 十 8 (6.56) 
其 中 及,B6 部 分 相应 的 自 变 量 是 属性 因子 , 即 了 是 0 一 1 矩阵, 称 
:0 为 方差 分 析 部 分 ; 而 下 sy 部 分 相应 的 自 变 量 是 数量 因子 ， 即 
于 s 的 元 素 允 许 连续 取 值 , 称 及 sy 为 回归 分 析 部 分 为 了 以 后 讨 
论 方便 , 我 们 总 假定 
1( 是 1) mA( 且 9) 一 {0， 码 3 满 列 秩 ， (6.57) 
一 般 地 说 (6.57) 在 实际 问题 中 能 够 满足 如 46.57) 不 满足 , 会 给 
统计 分 析 带 来 一 些 麻烦 , 这 点 可 由 后 面 的 讨论 看 出 。 . 
就 试验 模型 而 言 ,6.56) 中 的 及,B 往往 反映 试验 中 能 够 由 人 
们 精心 设计 和 严格 控制 的 部 分 , 而 下 7 则 常常 是 试验 中 那 部 分 元 
法 由 人 们 控制 和 掌握 的 因素 的 作用 。 这 类 情况 在 实际 问题 中 是 极 
常见 的 . 
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协 方差 分 析 模 型 中 较 简 单 的 例子 ， 就 是 在 单 向 分 类 模型 中 添 
加 一 个 因子 的 回归 项 , 使 模型 变 成 

Yiww— Bo Bitirwy + em, Ss=1, ,7, k=h=1, ,nm 

(6.58) 
这 里 试验 次 数 为 n=. 

R. A. Fisher 在 他 的 名 著 <Statistioal Methods for Research 
Workers» 中 首先 提出 了 协 方差 分 析 的 应 用 . 他 考虑 了 以 (6.58) 
为 模型 的 实例 .， 设 有 > 种 提高 茶树 产量 的 处 理 ,yz 表示 接受 了 第 
i 种 处 理 的 第 上 棵 茶树 的 产量 .试验 中 误差 的 一 个 重要 来 源 是 某 
些 处 理 磁 巧 被 安排 在 产 茶 能 力 较 强 的 一 些 树 中 ， 设 以 全 ww 记 荣 树 
在 接受 处 理 前 的 产量 ， 由 于 茶树 的 相对 产量 说 明 它 对 年 份 是 稳定 
的 , 芯 w 可 用 来 作为 茶树 的 产 茶 能 力 的 预报 因子 . 添加 ww 这 一 因 
子 可 以 调整 各 处 理 下 茶树 的 平均 产量 ， 从 而 消除 因 茶 树 的 产 茶 能 
力 而 造成 的 差异 , 使 我 们 得 到 较 低 的 试验 误差 , 并 给 出 较 精 细 的 各 
处 理 闻 的 对 比 ， 又 如 要 比较 两 种 饲料 的 配 比 对 加 速 小 猪 增 重 的 影 
响 ， 这 时 ,小 猪 的 初 重 应 作为 一 个 回归 因子 考虑 在 试验 模型 中 ,这 
类 在 协 方差 模型 中 被 考虑 的 回归 中 的 自 变 量 , 称 作 协同 变量 , 或 称 
干扰 变量 .理由 是 因为 这 类 变量 不 是 试验 中 能 予以 设计 和 控制 
的 , 也 不 是 试验 所 关注 的 条 件 。 引 进 协 同 变 量 还 有 其 它 一 些 作用 ， 
但 最 通常 的 意义 正如 以 上 所 述 . 

在 引进 了 协同 变量 卫 之 后 ， 对 模型 作 统计 分 析 时 将 涉及 站 
和 了 的 样本 苏 方差 的 计算 ， 协 方差 分 析 的 名 称 ， 大 致 上 就 是 由 此 
而 来 的 . 


(二 ) 基 本 方法 
在 协 方差 分 析 模 型 (6.56) 中 , 统计 推断 的 主要 对 象 是 6 现 
在 我 们 来 讨论 如 何 运 用 § 6.2 和 6.3 中 的 方法 达到 这 一 是 的 . 
模型 (6.56) 可 改写 为 
2 一 下 1B 十 8， 
其 中 9. 一 2 一 发 yy。 因 yy 中 含 未 知 参数 ,不 能 将 y, 看 作 观 察 值 
«280 


向 量 。 处 理 的 办 法 是 在 9, 中 以 ? 的 一 个 适当 的 估计 景 少 代替 ， 
从 而 得 到 一 个 以 2 一 8 一 全 s9 为 观察 值 向 晤 的 方差 分 析 模 型 


2=— EB-ter. (6.59) 
事实 上 ,人 可 从 (6.56) 消 去 方差 分 析 部 分 后 导出 的 模型 
Priy— Pr¥syt Prie (6.60) 
佑 出 .〈6.60) 的 正规 方程 是 
站 2 天 站 吵 一 是 2 人 ri21 


由 (6.57) 不 难看 出 
TEE Px; Es = rk Pr R=7rEk— dim(w(wi) (Vw (Wa)) 
一 型 。 (用 到 附录 A.1.2 与 .6) 
于 是 有 = (££sPr: Xa) EPry. 故 得 
z= [TI— (Eo Pr ) 下 2 天 ri]21. 
现在 可 以 看 出 , 对 模型 (6.56) 中 方差 分 析 部 分 的 统计 分 析 , 可 
通过 纯 方 差分 析 模 型 (6.59) 进 行 。 由 于 已 经 消去 芷 sy 项 , 可 直接 
应 用 方差 分 析 中 的 现成 结果 , 这 就 带 来 了 很 大 方便 . 
一 般 用 剩余 平方 和 表示 模型 精度 . 对 于 模型 (6.59), 剩余 平 
方 和 为 
SS — | Przl” 
一 | [Px — Pr Xo Xs Pr Xs) Prilyl? 
-yy Pry —y Pr Ko( XPr: Xs,) -1&2Pry 
—y Pry—y Py. 
其 中 风琴 (Px: 半 ，)。 如 果 不 引 进 协 同 变 量 ， 就 相当 于 在 模型 
(6.56) 中 令 y 一 0 这 时 模型 的 剩余 平方 和 就 是 SS, 一 y'Priy， 故 
y Py 这 一 项 可 看 作 引 进 协 同 变量 (也 就 是 使 用 协 方 差分 析 ) 在 提 
高 精度 方面 的 收获 。 由 于 在 对 (6.59) 作 方差 分 析 时 必然 出 现 如 
下 92 这 样 的 量 的 计算 , 似 与 革 和 2 的 样本 协 方差 相近 , 故 称 
之 为 协 方差 分 析 , 
在 协 方差 分 析 模 型 (6.56) 中 ， 也 可 讨论 回归 因子 的 显著 性 检 
验 . 设 上 ,是 9 列 的 ,可 考虑 检验 假设 . 
Ho ?yz 一 … 一 7a 一 0。 
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记 下 as=- [天 si ; 已 s9], 其 中 下 sa 为 不 列 。 则 假设 瑟 。 成 立时 的 模型 
为 

8 一 下 1B 十 下 aiyc 十 8。 
其 中 yw 一 《yi 7o 它 的 剩余 平方 和 为 SBS。 一 | Per 全 
而 模型 (6.56) 的 剩余 平方 和 为 SS 一 [Ps,: xy 7. 令 SSy=SSo 
一 SS,, 知 SS 与 SS 独立， 记 7k 目 1 一 7 可 得 


为 检验 统计 量 ， 当 互 。 成 立 , 有 8 一 0. 得 水 平 为 “的 拒绝 域 是 
F>Fo_y,n_r-a(0). 
其 余 问题 , 或 者 已 在 上 两 节 中 讨论 , 或 者 留待 下 节 讨 论 , 不 一 
一 效 述 , 


$6.5 一 般 线性 模型 的 统计 推断 


本 节 将 摆脱 实际 背景 , 也 不 涉及 $ 6.1 中 的 分 类 , 从 理论 上 折 
象 地 讨论 一 般 线性 模型 的 参数 统计 推断 。 当然 ,这 些 讨论 只 在 本 
书 宗旨 所 规定 的 范围 内 进行 . 

设 一 般 线性 模型 为 

y=— B+ie. (6.61) 

其 中 脏 是 任意 的 mxp 阶 实 阵 , 7 时 <p, m>>2D。 加 是 未 知 参 数 向 
量 ,如 不 加 其 它 约 束 , 认为 它 可 在 整个 BR 中 取 值 。 对 误差 向 量 8， 
至 少 作 假定 Be 一 0， 在 稍 后 的 讨论 中 ,还 需 假 定 它 的 协 方差 结构 
(如 Coys 一 o3 或 Covs 一 o?G>0), 并 假定 它 的 分 布 形式 ( 仅 讨论 
正 态 情形 ) , 这样 的 线性 模型 是 很 普通 的 , 故 名称 中 的 “一 般 ” 一 字 ， 
实 指 “普通 ”而 言 ， 我 们 不 讨论 协 方差 矩阵 退化 情形 ， 因 为 那 种 情 
形 下 将 不 可 如 免 地 要 用 到 广义 道 秆 阵 , 


(一 ) 可 估 参 数 函数 及 其 估计 
让 我 们 从 参数 向 量 @ 的 最 小 二 乘 信 计 谈 起 ， 按 §6.2( 二 ) 中 
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定义 , 最 小 二 乘 佑 计 是 极 小 值 问 题 min| 了 Y- 及 B 上 的 极 小 值 点 , 它 
是 正规 方程 耻 耻 一 了 'y 的 解 . 

为 了 进一步 讨论 最 小 二 乘 佑 计 的 性 质 ， 我 们 再 用 直观 的 几何 
方法 去 求解 上 述 极 小 化 问题 . 19 -下 Bi 是 嫩 中 2 与 时 6 的 距 
离 ， 当 B 在 RE? 中 变化 时 ， 脏 B68 张 成 鼠 " 中 线性 子 空间 由 一 扩 及 ). 
极 小 化 jy 一举 B1l， 就 是 在 (时 ) 中 求 一 向量 使 之 与 y 的 距离 最 . 
小 .根据 附录 A.6.2, 要 求 入 习 量 正 是 9 到 人 凡 且 ) 的 正 投影 , 可 记 


为 Pry. 即 有 人 入 
XB= Py. (6.62) 


此 结果 的 几何 解释 见 图 
6.4， 不 难 君 出 (6.69) 与 
正规 方程 是 等 价 的 ， 一方 
面 由 06.62) 左 乘 下 ,用 正 
投影 阵 Pz 的 性 质 立 得 正 
规 方程 ， 另 一 方面 , 如 果 
满足 正规 方程 , 应 有 |& 
-XB ly- Prof. 注 站 
意 到 |Pxy -XBl?=|y 一 XBl:-1y 一 Pxyl?=0, 可 得 (6. 62). 

在 是 不 满 列 秩 (rLk 革 < 二 p) 的 情形 下 ,正规 方程 有 无 穷 多 解 , 故 
此 时 谈 有 的 最 小 二 乘 估计 似 无 实际 意义 ， 习 惯 上 就 称 有 为 不 可 全 
的 ， 为 此 需要 引进 以 下 概念 . 

定义 6.5 可 估 参 数 函 数 

设 qa'6 是 参数 的 线性 函数 ,如 果 有 2 的 线性 函数 c2 使 得 
Bc'y 一 4'B, 则 称 8 是 参数 B 的 可 估 函 数 , 简称 可 估 的 ; 否则 称 
0'B 是 不 可 估 的 ， 

我 们 容易 证 明 

定理 6.4 

在 模型 (6.61) 中 ， 

2:B 可 佑 所 CEA ). 
证 由 定义 6.5 得 :mwB 可 估 人 23c 使 BeV=cAB=-cCC 对 
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一 切 BER?<>3c 全 CX=a 人 aEnu(X’). 
系 1 和 KB 的 每 个 分 量 el 处 B, ;一 1,…, mn 都 是 可 入 的 ,这 里 
@ 是 单位 阵 上 的 第 列 ， 即 et 一 (0…010…0) (在 本 书 的 后 面 


部 分 , 我 们 将 使 用 6 始终 表示 这 一 向 量 , 而 它 的 整个 维 数 , 可 随 使 
用 的 场合 而 定 ,)2° 如 rh 六 一 p， 则 对 一 切 4 EB?, BB 均 可 估 ， 如 
?Lk 六 <p, 则 B 至 少 有 一 个 分 量 , 设 为 B=esB, 是 不 可 信和 的 . 

证 明 是 直接 的 , 留 作 练 习 . 

称 7% 导 <p 的 模型 为 降 秩 的 ， 否 则 为 满 秩 的 。 降 秩 模型 中 6 
不 可 估 ( 即 至 少 有 一 分 量 不 可 佑 ) 的 理由 可 由 正规 方程 多 解 性 说 
明 , 因 降 秩 时 及 着 B8 一 0 有 非 零 解 Bo, 则 若 B, 一 B+Bo, 必 有 在 B， 
一 作 B ,而 B 在 模型 中 的 作用 是 通过 站 B 体现 的 , 故 从 模型 无 从 推 
法 B86 各 B, 的 差异 . 举 一 个 简单 的 例子 ， 将 真实 重量 为 B1 和 Bs 
的 物体 , 同时 放 在 天 平 的 右 盘 上 称 三 次 , 得 称 重 为 9j， ya, ys, 于是， 


模型 为 ys 1 1 gy 
Ys 1 1 名 83 


显然 此 模型 是 降 秩 的 , 6 不 可 估 , 其 理由 也 可 从 这 种 称 法 本 身 不 能 
区 分 Bi 和 Bs 而 得 到 说 明 . 
设 @'B 是 可 估 的 , 记 @'B 的 线性 无 偏 信 计 的 全 体 为 
Gua)={cy Bey-ab 对 — 切 BER'. 
定义 6.6 最 优 线性 无 偏 估计 
潜 68y EEGv(&) 满 足 
Db'Yy)= min Dle'y) (6.63) 
则 称 22 是 a'B6 的 最 优 线 性 无 偏 估计 (BLUE)， 也 称 极 小 方差 线 
性 无 偏 估计 《MVLUE)， 习 惯 上 还 称 作 Gauss-Mapro8 估计 
(GME). 
定理 6.5 (Gauss-Mapk0B 定理 ) 
没 在 模型 (6. 60) 中 假定 8 是 不 相关 同方 差 o? 的 《 即 Cov8 一 
o2 帮 ,a'B 是 可 佑 函数 , B 是 正规 方程 的 任 一 解 , 则 w' 人 后 是 wB 的 
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唯一 的 最 优 线性 无 篇 信 计 ， 
证 因 @B6 可 佑 ,存在 bE BP', 满 足 a'=b' 导 .从 而 有 
Ea'B=- nb XB Eb Py=b PXB-bXB=a’'B. 
得 BEsav(a)， 任 给 cyEao(a)， 易 见 a'c' 蛙 .于 是 a'6~ 
c' 有 一 c'Pxy， 这 就 有 
D(C)=occ>ocPrc=D(c'Pry) -D(a'p ). 
得 a'B6 是 最 优 线性 无 偏 估 计 . 又 车 上 式 等 号 成 立 , 有 c'c=c'Pxe， 
可 推出 c'(1-Prx)c=c’ Pxrc=0, 从 而 有 上 Pz cl?=0, 得 Pric= 
0, 即 c 二 Prc， 因此 cYy=c Pry=a'B， 故 有 BLU 的 唯一 性 , 
证 毕 . . 
定理 6.5 表明 ， 当 a 人 8 可 估 (wEn《w)), 1 不 依赖 于 户 是 
正规 方程 的 哪个 解 。 因此 , 不 管 下 是 否 满 列 秩 ， 义 B 总 是 唯一 的 
(事实 上 已 由 (6.62) 保 证 )， 
附注 ， 如 果 取 消 Cov 8 一 o3 了 的 假定 ,可 估 性 与 最 小 二 乘 估计 
并 不 改变 ,但 /6 就 不 一 定 是 wB 的 BLUE。 如 对 e 的 协 方差 阵 
改作 如 下 假定 
Oov 8 一 03G, 这 里 G 是 已 知 正 定 阵 . 
这 时 模型 可 记 为 Vw (下 8, csG). 不 难 求 出 在 此 模型 下 的 BLUB， 


办 法 是 令 z 一 GT-2。 原 模型 化 为 zw(G- 生 尼 B，ca7)， 在 此 模型 
下 定理 6.5 给 出 a6 的 BLUE 是 wi, 这 里 户 是 正规 方程 

(KX'G-+:X)B- XG-'y (6.64) 
的 解 。， 称 户 是 模 昏 y~( 玉 B, o3G) 的 加 权 (G) 的 最 小 二 下 估计 . 
a 有 忆 是 a'B 的 BLUBE， 模型 y~(B，o’G) 是 Aitken 于 1935 
提出 的 . 

对 于 模型 y~( 玉 B, cs)， 记 B-2y 一 全 G， 称 作 剩 余 ( 或 残 
差 )， 并 称 | 人 ?一 | Pi 为 剩余 平方 和 ， 在 86.2 中 已 经 提 到 条 
余 平 方 和 除 以 它 的 自由 度 18la/m 一 (7 一 他 羡 ) 是 oa 的 无 信 信 计 ， z 
证 为 全: 

在 假定 s~ 入 ,C0, o3 了 1) 时 ， 估 计量 2 和 @'6 有 的 项 良 
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性 ， 先 证 明 如 下 的 

引 理 6.% 对 于 正 态 模 型 8V~N (了 B, oT)，T a(y'y, 
B' 轩 站 ) 是 关于 分 布 族 {Plweo} 的 充分 完备 统计 量 ， 这 里 Pos,os 
是 入 ,( 素 B, a? 了 ) 的 分 布 , BE Rs, o?>0. 

证 ”由 于 Pte,oo 的 密度 函数 是 


fo po- (2m0’) Soxp| -i ly ~ 6 
~(aro’) foxp{ — sly -XA+ XB -XBI") 


203 


~ (2n0’) foxp| — 1 [yy —B'X'XAI| 


2G2 
“oxp{ 一 218 


根据 定理 2.3, 可 得 T=(y'y, B' 玉 下 ) 是 完备 充分 统计 量 ， 

从 而 可 得 

定理 6.6 

对 于 正 态 模型 y~N,( 玉 8B，o 开 )， 设 aiB 是 可 估 的 ， 则 有 
wp 和 6 分 别 是 @B 和 cs 的 唯一 的 一 致 极 小 方差 无 偏 估计 
(UMYUE). 

证 ”由 定理 6.5 已 知 a%B6 和 人 分 别 是 aB 和 o? 的 无 偏 信 
计 ， 
不 难 将 aB 和 6 表 成 TP 的 函数 ， 为 此 ， 先 设 息 是 满足 
XX 四 A 一 下 的 矩阵 (由 附录 A.3.2 可 验证 A 的 存在 性 )， 因 a8 
可 估 , 有 a 一 BX, 故 得 a=b Bb 4 了 6， 且 有 

-ly- XB -yy BX XB -yy-B'X XAAX'EB. 

青 由 引 理 6.2 和 定理 2.2 即 得 要 证 的 结论 . 


(二 ) 受 约束 线性 模型 的 参数 估计 

在 (一 ) 中 讨论 可 全 函数 @ 避 时 ， 我 们 认为 有 是 在 B&B? 中 不 受 
约束 地 变化 的 、 但 在 实际 问题 中 , 6 不 一 定 能 无 拘 无 束 地 变化 , 它 
往往 受到 各 种 因素 的 制约 。 有 时 为 了 技术 上 的 需要 (如 在 作 非 均 
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衡 情形 的 方差 分 析 时 ) ,也 对 有 施加 人 为 的 约束 这 类 约束 中 , 最 
常见 的 是 如 下 的 相 容 线性 约束 
HB-t 
这 里 五 是 一 个 xp 阶 已 知 矩 阵 ， 不 失 一 般 性 常设 rk 五 = 友 ， 
注意 到 右 有 右 道 吾 ./， 芭 满 足 HH,= 了 J， 作 变换 2=y 一 
下 H,E, 96aB- HE, 可 将 原 模型 变 成 z~( 了 90, oI H9 一 0)， 这 
里 圆 括 弧 中 最 后 一 项 天 示 对 参数 的 约束 ， 因此 ,只 讨论 齐 次 约束 
HB 一 0 不 会 有 实质 性 的 损失 , 却 能 使 推导 较为 简洁 ， 下 面 限于 讨 
论 受 约束 模型 
y~ (XB, ol;, HB=0). (6.65) 
回顾 (一 ) 中 关于 可 估 性 的 定理 6.4， 注 意 到 证 明 中 用 了 有 的 
任意 性 , 故 在 附加 约束 瓦 B=0 后 ,可 估 的 充 要 条 件 变 为 
3c 使 得 c'"XB=aB 对 一 切 HB 一 0， 
它 等 价 于 
3c 使 得 c' 及 BaB 对 一 切 BEn'(H")， 
又 等 价 于 对 caeEn( 惠 ), 即 
a€En((¥’: H))~n(X)+n(H). (6.66) 
因 6 满足 约束 吾 B 一 0，B 的 估计 量 户 亦 理应 满足 HAE 一 0. 
于 是 ,最 小 二 乘 估 计 也 就 推广 为 受 约束 最 小 二 乘 估计 司 *， 它 满足 
ly — XBrl?—minly— Xb (6.67) 


用 平方 和 分 解法 不 难 求 得 (6.67) 的 解 ， 不 妨 设 Be 满足 (6.67)， 
我 们 有 
Iy— X61 1y— XBnl + 1 RB bl 
+2(Ba-b)'X'(y— XBn). 
可 知 By 是 方 禄 
(Br-b)'X'(y -XBr)-0 对 — 切 Hb-0 (6.68) 
的 解 .。 仿 可 佑 性 的 讨论 , 知 (6.68) 等 价 于 


1) 因为 凡 可 以 被 其 它 约束 式 线性 表示 的 约束 式 实际 上 是 无 意义 的 , 在 删 去 这 些 天 
意义 的 约束 式 之 后 , 万 就 满 行 秩 。 
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X'(y- XB ENB) 
即 存在 入 使 得 入 一 卫 久 Bn 一 HX， 从 而 Bn 是 方程 
I 
H 0 入 0 
的 解 ， 称 (6.69) 为 模型 (6.65) 的 正规 方程 . 


不 难 证 明 (6.69) 是 相 容 的 ， 事 实 上 , 假设 p 维 向 量 c 和 维 
向 量 d 满足 


于 HH’ 
(ce’ a j= 
0 
则 有 (c+rdH: cH =0. 


可 推出 Hc=0. 于 蚌 得 
0=c’X'c+dHc=c's’Kc. 
因而 有 入 c 一 0， 故 得 


(ec' of。 ”)-0 


由 附录 A. 3.2 知 (6.69) 有 解 . 
设 记 i 为 (6.69) 的 解 ， 有 Bx 人 Ly， 由 HB,-0 可 得 HLy 
一 0, 因 此 Cov(HLy) 一 oHLL'H'’~0, 得 
HL-0. (6.70) 
由 正规 方程 知 
(XRILy+HA- RY (6.71) 
左 乘 元 推出 
LX'RILY -LX'y, 双 有 IL XXL LY, 
得 和 了 是 对 称 窜 等 阵 , 即 正 投影 阵 Prs， 从 而 有 
KBs = Priy. (6.72) 
对 上 芷 上 可 给 出 如 下 引 理 . 
引 理 6.3 
设 Ly 是 正规 方程 (6.69) 的 任 一 解 ， 民 是 满 是 ER) 一 NIE) 
的 方 阵 , 这 里 入 ( 吾 ) 是 HH 的 零 空 间 , 则 有 
p(kL)=p( XE), 
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且 rhXR) -rb (B ) -ri 


证 因 及 及 =0, 由 (6.71) 易 见 
EXXLy= RX'y, 
可 推出 了 RLXXR- 六 LXR,， 得 j( 芋 R)Cpu( 居 L)， 但 是 
DCN(H)=-n(R), 因此 4( 革 L)Cm( 和 BR)， 得 要 证 之 结论 
LCXL)—u( XR). 
由 附录 A.1.2 立 得 
ybER=yER_ dim(u( RNNCX)) 


ms) 


-人 


.4 
-7 (Bm (6.73) 


定理 6.7 

设 Yy~( 玉 8B, oI, HB 一 0)，Bs 是 受 约束 最 小 二 莱 估 计 ( 不 
一 定 唯一 ) ,qa'B 是 可 舍 函 数 , 则 ea 是 ml 的 唯一 的 BLUE. 

车 记 88 一 [8 一 下 Bla/m 一 ss 如 (6.73) 定 义 , 则 妈 是 oa2 的 
无 偏 估计 . 

证 因 @'B6 可 佑 , 必 有 d, 入 满足 4a 一 Xd+HNA. 上 且 当 cy 
是 到 B 的 任 一 线性 无 偏 和 估计， 又 有 内 使 得 0 二 耻 c+Hih、， 再 注 
意 到 HB 一 PBy 一 0， 其 余 证 明 参 照 定理 6.5， 从 而 得 /Bn 是 
了 BLUE. 

由 于 58 一 1y 一 Bul3/n-s=|Pozwyl’/n—s, 而 op 一 
s， 易 见 58 是 o? 的 无 镜 估 计 ， 证 毕 ， 

下 面 我 们 讨论 ; 如 何 附加 约束 才能 使 原 模型 不 缩小 ? 设 模型 为 
8 一 下 BT8, BER2， 如 欲 加 约束 使 模型 不 缩小 , 意味 着 

{XB. BER’) — {XB. HB -0 ={XB. BENCH)}. 
由 引 理 6.3 知 
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{XB. BENCH)} = {XB. BEn(R)} —{XRB. BER'). 
因此 , 要 模型 不 缩小 , 充 要 条 件 是 
rE(RR)=re(¥’: H)—rpH’=7rkE, 
它 等 价 于 
p(X NH) {0. (6.74) 
设 mk 及 =”<p, 由 (6.74) 易 见 约束 矩阵 五 的 秩 至 多 为 p 一 7. 
在 满足 (6.74) 的 条 件 下 附加 约束 ， 对 模型 的 统计 推断 不 会 发 
生 任 何 实质 性 的 影响 ， 从 信 计 的 角度 看 ,我 们 有 如 下 结果 
定理 6.8 
设 模型 y~( 及 8, o?1; HB 一 0) 满 足 条 件 (6.74), 又 设 它 的 可 
估 函 数 wB 的 最 优 线性 无 偏 估计 是 a' 人 Ba, 则 有 
a'By=a’'p, (6.75) 
这 里 司 是 模型 g~ (下 8B，ca 丰 的 正规 方程 玉 芭 BB 一 下 的 满足 
五 =0 的 解 . 
进而 , 当 条 件 
rh((K’: H))=p (6.76) 
满足 ,上 面 的 Bz 和 都 是 唯一 的 . 
证 由 可 估 性 条 件 知 存 在 c，k 满足 a 一 c' 肝 十 jv' 且 根据 
(6.72) 得 
a'Ba= (CcC' 及 +uH)Bnr=c'¥Bn=e'Pry. 
由 条 件 (6.74) 得 1 下 克 一 08( 有 下 : 五) 一 08 五" 一 个 下 因此 天 cr 
一 Px， 从 而 得 
a'Buy=c'Pry=c'XB= (a' -pHB=a'B. 
”在 条 件 (6.76) 满 足 时 , 有 


了 (6.77 
( 及 0 /是 满 秩 库 6.77) 
事实 上 , 若 有 
0 人 + )- FX: OH), 
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知 dH'0, 李 下 一 0, 即 得 要 (下 ' 下: H')=0， 故 由 条 件 (6.76) 
立 得 d=0, 从 而 又 有 了 一 0, 得 (6.77)。， 因 此 Bx 作为 方程 (6.69) 
的 解 是 唯一 的 ， 且 B 作为 
KX\ a /KX'y 
| H )# -( 0 ) 
的 解 也 是 唯一 的 . 
(三 ) 区 间 估 计 


在 本 段 和 下 段 中 ,我 们 限于 讨论 正 态 模型 g 一 N。( 站 8B， ca 站 ， 
先 给 出 一 个 关于 统计 量 分 布 的 结果 ， 
定理 6.9 
设 ec 是 一 个 mxzp 阶 和 矩阵 ,满足 
c= 了 K+ HS, K,S 任 给 ， 


Bu 一 1y 是 (6.69) 的 解 ,SSuee 1y 一 XBsl*, 则 有 

1i° eBun~Nn(K'Pyr XB, okK' PrrK); 

2° SSae/asXa sf(3), 其 中 s 一 98( 是 :再 门 一 人 (五 和 ,32=: 
BX’P.xrr KB/o’ 

8 cBs 与 SS, 独立 . 

特别 ， 当 五 ~0 时 ， 有 c= 了 XK, wu(XL)=p(), Ba-B, 
则 有 

cB~Nn(XB, orK'PrKR), SS,/or~x?r, CB 与 SS, 独立 ， 

其 中 88S。= 18 一 下 Ba 7 一 rb 于 . . 

又 当 互 8~0 满足 , 则 有 Bc'Bx=c’pB, XBEnCXL), 且 5’ 
一 人 

证 明 是 直接 的 ， 留 作 练习 . 

现在 讨论 区 间 估 计 问 题 . 对 于 无 约束 模型 y~N,(XB, ca 门 ， 
设 ,c'B 的 各 分 量 均 可 估 , 并 且 设 vic 一 mm. 则 有 下 满足 c 一 下 天， 
不 难 验证 KK'PxK 是 满 秩 的 . (事实 上 ， 设 KPrKt~0， 则 有 
PiRt-=0， 因 此 了 PKt 了 Kt=ct 一 0 得 t=0. ) 由 定理 6.9 
立即 可 得 
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pa (B-B)e(K'PrR)-!e(B-B). nr p 
gg 
(6.78) 
这 是 因为 c(B6-B)=K'X(B6-B)~K'Pr(y 玉 8B)， 从 而 有 
(BB-B)'c(K'PxR)-ic'( 记 -B)/or~x3, 而 它 与 SS 的 独立 是 明 
显 的 ， 设 1 为 君 信 系数 , 则 有 
P{F<Fnnr(0)}—1—a. 
记 BR" 中 椭 球 
Ge 局 -~ 世 (zeBY KPR)-z- e'B) 
mso) 
六 一 字 
则 有 了 {cBEQG(le'h)} 1-a， 因 此 G(e' 忆 ) 是 cB 的 置信 系数 
为 1-a 的 轻信 椭 球 . | 
在 m1 的 特殊 情形 ， 一 般 用 太 变 量 给 出 可 信函 数 m 的 区 
间 信 计 . 因 a 全 存在 满足 a~ 玉 ,二 是 a'B~N,(a'p, 
ob'Pib). 


< 


pa (BBViTr 
SS bP6 


不 难 算出 @'B6 的 置信 系数 为 1 一 wa 的 区 间 佑 计 是 
| @'B -VBS Prb/m—r (各) 


~ tr. (6.79) 


a’B+ VS PE rh -/($ | 


(四 ) 一 般 线 性 假设 检验 
设 模型 为 y~N， (下 6, o3 了 J)、 称 
Ho. HB=0, eH =E) 
为 一 般 线 性 假设 . 
为 检验 五, 可 用 似 然 比 导出 检验 统计 量 ， 令 似 然 比 


2 sa 人 人) 


入 会 
Mx max{L(y;B, o), HB=0, o>0}’ 


(6.80) 


ao093。 


其 中 L(y; B, oo)=0- "exp{ - 码 1 oy — XBL*|, 


《已 略 去 常数 因子 ) 记 
SS,—min{ly ~ ApBI’, BE Rr}, 
SSn=—min{ly— ABI’, HB=0}, 
人 
S,—ly— BI, SSs= ly — EBal’. 
于 是 到 一 cea SS,./20”), > 中 容易 用 简单 的 分 析 方 


法 求 得 ， 它 在 全 ~ Pe 处 达到 , 而 
or-( 踢 ma(- 呈 

ji 有。 

Ki 和- 间 -( 且 请 


SS, 与 SS 不 独立 ,对 入 予以 变形 得 
n= (Su Soe Ht) a (SSn/SS,+ 1 (6.81) 


注意 到 入 是 SSa/8SS。 的 严 增 函 数 , 似 然 比 检验 的 否定 域 信之 oj 易 
于 用 8Sz/SS。 表 出 .根据 定理 6.9, 我 们 有 


pe I~ Pr wn (6.89) 


其 中 + 一 rp，S 一 p(X :; H) rpH', 0 XB-— XBBaf | 


当 假 设 成 立 , 了 ~ 了 i,_s,n-r， 因 此 水 平 为 a 的 拒绝 域 可 取 
{F> Ps 0)}. (6.83) 
至 此 , -- 般 线性 假设 的 检验 问题 已 在 理论 上 得 到 解决 . 关于 
这 一 了 -检验 的 优良 性 问题 ,已 由 许 宝 台 教授 在 1941 年 解决 . 
下 面 我 们 讨论 前 几 节 中 所 用 的 方差 分 析 方 法 在 何 种 模型 下 可 
行 的 间 题 ， 
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首先 不 难看 出 ,上 面 用 似 然 比 引出 的 检验 , 也 可 以 用 方差 分 析 
来 解释 .我们 有 
1 一 [rr 人 十 Pre 一 人 2 十 8 
全 |Pyy):+SSyt SS,. 
其 中 SS 是 原 模 型 的 剩余 平方 和 ， 它 反映 了 模型 的 精确 程度 ， 而 
SSz 是 附加 约束 后 模型 的 剩余 平方 和 与 原 模 型 的 剩余 平方 和 之 
差 , 它 反映 了 引进 约 东 后 增加 的 误差 情况 , 如果 约 束 客 观 上 存在 ， 
即 假设 是 8B 一 0 成 立 , SS 理应 甚 小 , 反之 ,SS 应 人 往 大 。 在 这 样 
的 统计 解释 下 ,我们 可 来 用 妈 作为 检验 统计 量 . 另 外 ,注意 到 SSz 
是 入 变量 , 当 假设 五 ,成 立时 , 它 是 中 心 的 x? 变量 , 否则 为 非 中 心 
x 变量， 下 面 的 引 理 6.4 给 出 了 二 者 的 均值 的 比较 , 可 作为 选择 
单 边 拒 绝 域 的 理论 说 明 . 
引 理 6.4 
设 2~Notm 了, 记 5 一 y'Pyy, Px 是 到 子 空 间 .22 的 正 交 补 
空间 的 投影 阵 , 则 ~x3G), 这 里 Cg 一 m 一 dim2 5 一 MP 并 
且 有 
BE =d+p Pn. (6.84) 
故 当 pwE 如 比 wE 少时 ,# 有 偏 大 趋向 . 
证 由 附录 .6.2, 知 Pz UU 这 里 如 满足 UU=. 记 
0 一 Up/5， 作 正 交 阵 C= (Cin…ca)， 令 wW=-c Uy， 则 有 Bw 一 
(60…0)', 得 
TNa (B00) Ta), E= 0%. 
因此 有 Ee = Boi 31H = dt 0 证 毕 .。 
下 面 从 方差 分 析 的 角度 来 讨论 对 设计 阵 下 的 要 求 ， 设 模型 
为 8V~N (和 Ba)， 先 设 是 按 具体 问题 分 为 两 块 的 情形 ， 即 
有 下 一 (站 ; 下 3)， 相 应 有 B' 一 (84584)， 记 赂 一 肥 ( 尼 ) i=1, 2, 
彤 一 人 (下 )， 我 们 给 出 方差 分 析 可 行 的 条 件 ， 
定理 6.10 
yl? 可 以 分 解 为 相互 独立 的 二 次 型 的 和 
上 1 有 = 一 58 二 SS TS SS (6 .85) 
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并 且 S31 和 SSs 可 以 分 别 解释 为 由 第 一 个 因子 和 第 二 个 因子 引 
赵 的 平方 和 的 充 要 条 件 是 
uwNnut uf nz. (6.86) 
证 首先 有 
[yl = Pyl?+lP, yl’, 记 SS.= IP, yh 
设 Ho:: Bw=0 是 要 检验 的 零 假设 ,$= 一 1，2.、， 当 及 0; 成立， 模型 的 
璋 余 平 方 和 是 1P;, yl>, 因此 
RS 一 | 成， yl — 1 Pyl’, i=1, 2. (6.87) 
被 认为 是 外 因子 对 的 存在 对 2 有 影响 而 引起 的 ， 简 称 为 由 因 
子 i 引起 的 平方 和 ， 为 了 使 因子 1 和 因子 2 的 影响 (在 模型 中 下 
现 为 玫 1C 和 下 s8) 与 其 它 影响 (如 误差 的 影响 , 交互 作用 的 影 
响 等 ) 分 离开 来 ,条 件 是 SS1,， SS 独立 , 并且 要 使 得 1y|? 一 SS 一 
SS1 一 SSs 人 So 是 非 负 定 二 次 型 , 从 而 可 应 用 Qochran 定理 ,得 
到 假设 检验 所 需要 的 统计 量 . 
注意 到 SS1 一 1(P, 一 了 Po)y1”, 由 附录 A.6.5, 知 Py 一 Ps 一 
Pa, 相仿 PP 一 P= Pns,, 因此 S51 与 S53 独立 的 充 要 条 件 
是 (6.86). 
由 于 
SS 一 2 一 | 有 8 天 一 88 一 人 na 人 
一 2 [到 ,一 Ca | 
由 A.6.2 得 Pn,+ Pn 是 正 投影 阵 ( 用 到 条 件 (6.86)),， 它 是 
到 丸 的 一 个 子 空间 工 的 正 投影 ( 因 jNnpt, pnNpicm), 故 有 SBo 
一 | Pwyl?， 定 理 得 证 . 
系 1 
设 (于 1) 站 (四,) 二 人 0}, 则 (6.86) 成 立 的 充 要 条 件 是 
(1 会)n(R) LCR) (Eo). (6 .88) 
证 由 (6.88) 推 出 凡 =jw 十 ua( 正 交 直 和 和 ), 于 是 人 Nl = ja， 
下 对 一 Ap 故 有 (6.86). 
反之 , 当 (6.86) 成 立 , 因为 由 过 十 Rn 好 CC 而 凡 一 几 人 站/ 
十 pu 故 得 wwNw2Cp， 但 是 dim Mp2 一 dimpy 一 dimpa dimp 
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(第 一 个 等 式 是 因 为 及 一 及 人 /地 于 Na， 后 一 等 式 由 吃 几 Ma 一 f0} 
得 ), 于 是 凡人 i 一 wt， 同 理 有 wwt 一 wa， 得 证 . 
系 1 表 明 ， 当 rk 是 一 p( 即 振 满 列 身 时 )， 如 果 1 与 js 不 正 
交 , 将 无 法 将 iyl? 分解 为 (6.85) 中 的 形式 ,从 而 不 能 比较 两 个 因 
子 的 显著 性 程度 ， 由 于 在 回归 分 析 模 型 中 我 们 假定 站 是 满 列 秩 
的 ,因此 在 那 种 场合 ,为 了 方差 分 析 的 需要 ,应 使 下 "下 具有 分 块 对 
角形 , 即 
,wr (XH 0 
X32- 0 x 


但 对 于 方差 分 析 模 型 ， 不 必 对 设计 阵 有 如 此 严 客 的 要 求 ， 这 
时 , 只 要 有 因子 水 平 措 配 的 某 种 均 勾 性 , 条件 (6.86) 就 可 满足 , 例 
如 对 于 两 问 分 类 每 格 中 试验 次 数 相同 的 模型 (不妨 设 加 一 0) ,我们 
有 


设 @ 一 《at GD ELLEED)， 则 有 ceo 一 0，5 一 1 7 而 
1 是 ) 中 一 般 元 可 记 为 


,ws 

a ots : 

2 于 ;|+| tv。 
人 - 
uy . 

‘vo 


故 当 Ey( 莹 ) 们 wt( 罚 ), 有 
UPC Pv;= 0, 2 一 十， 人 


。 396 ， 


因此 一 了 20 十 Tv。 :C0 二 — 19s, %= TCD, 


vo 


相仿 可 求 出 , 当 SEJ( 昼 ) 站 pi (站 ), 有 


or 
s| : je V0= — DSI, 


,ows 

从 而 容易 验证 8s 一 0， 得 条 件 (6.86) 成 立 . 

定理 6.10 所 讨论 的 条 件 , 从 原则 上 说 不 难 推广 到 下 = (于 
… ; 已 ) 的 情形 ,但 复杂 程度 将 明显 增加 , 不 在 此 详细 讨论 . 

因子 试验 中 的 正 交 设计 是 为 了 减少 试验 次 数 而 提出 的 一 种 具 
有 相当 广泛 的 优良 性 的 设计 . 由 于 随 着 因子 数 的 增加 , 如 采取 全 
面 实施 的 试验 ( 即 对 每 一 种 水 平 搭配 均 进行 试验 )， 试 验 次 数 会 急 
剧 增加 。 为 了 减少 试验 次 数 ,只 挑选 部 分 水 平 搭配 做 试验 , 称 为 部 
分 实施 法 ， 这 时 ,为 了 方差 分 析 的 需要 和 尽 可 能 不 降低 精度 , 采用 
借助 于 正 交 表 设 计 的 试验 , 它 使 得 设计 和 矩阵 有 某 种 匀称 性 ,从 而 使 
条 件 (6.86) 成 立 , 同时 还 具有 其 它 优良 性 质 ， 具体 的 设计 和 分 析 
方法 ,可 参看 有 关 著 作 . 

最 后 , 在 结束 线性 模型 这 一 章 的 时 候 , 简略 地 谈 谈 可 转化 为 线 
性 模型 的 非 线性 问题 ， 从 而 可 看 出 线性 模型 所 能 处 理 的 统计 问题 
要 比 赁 直觉 看 到 的 更 为 宽广 . 

设 Y 对 my …，m 的 统计 依赖 关系 可 用 

y—F (wv, 06 Bi **%, Bo) 十 8 

刻 划 ， 这 里 B1, …， Bs 是 未 知 参 数 ，s 是 随机 误差 。 如 果 存 在 一 
个 可 道 的 连续 函数 ,使 得 


J (Pw, -0 Br)) 一 之 90504021 LAG “…, Br), 
并 且 满 足 


ea JI7 。 


(gi ，…，Vp)Fy(9 op) (Bi ~ Bop)F>(Pp1 ***, Pp) 
都 是 一 一 对 应 , 那么 , 记 z= 了 (9), ze 一 Bi 一 pi 一 1,，…,p, 原 
模型 可 近似 地 看 成 如 下 的 线性 模型 
:六 2 局 ,十 和 
当然 ,在 对 模型 作 了 变换 之 后 , 作 严 格 的 统计 解释 可 能 比较 困 
难 ,如 这 里 的 s 和 原来 的 s 的 关系 怎样 , 有 何 种 分 布 等 , 难以 精确 给 
出 .但 由 此 可 近似 地 用 线性 模型 的 方法 来 处 理 , 如 给 出 回归 直线 . 
然后 按 原 变 换 道 转 , 给 予 一 定 解 释 ， 这 上 毕竟 是 一 种 实用 的 方法 . 
有 具体 可 转化 的 类 型 很 多 ,不 在 此 列举 , 仅 以 一 例 说 明 . 如 研究 
猪 的 体重 (MH) 与 其 身长 (ZL) 和 和 腰 力 (如 ) 之 间 的 关系 ,如 从 经 验 获 知 
它们 的 关系 大 致 为 
M=—O.Le:. RSet 8, 
可 转化 为 y=log M=1log0O++Bilog Lt Balog Re. 
通过 观察 值 可 得 经 验 回归 方程 
$=B 十 Bai + Bawa. 
从 而 以 六 一 一 BoLABRA 
作为 对 猪 的 体重 的 预测 . 


附录 A ”统计 中 常用 的 矩阵 代数 


我 们 限于 在 实数 域 中 讨论 矩阵 和 线性 空间 ， 除 非 男 有 说 明 或 
在 不 得 已 的 情况 下 , 我们 总 用 黑体 字 表 示 和 矩阵 或 向 量 , 而 用 英文 花 
体 字 母 家 示 线性 空间 ,但 w 维 欧 氏 空间 按 习 惯 仍 用 "表示.， 


AL 

设 4 一 (4) 是 nxn 阶 算 阵 ， 需 要 注 明 阶 数 时 记 为 4 或 
Cay)mxn， 记 和 4 的 第 j 州 风量 为 
es。 398 ， 


CH 
0 一 : 3 二 ER”, j=1, “ 


ms 
由 i …, G0, 张 成 的 Rm 中 的 线性 ( 子 ) 空 间 
uA) = {Ew wo ER', j=—1, ev， n} 
称 作 4 的 列 空间 . 
将 和 殷 看 作 "到 RB” 的 线性 变换 ， 列 空间 (和 4) 就 是 4 的 值 
域 {Aw. wxER"}. 令 
NCA)={w. TER", 4c=-0。 
称 N( 妇 ) 为 4 的 零 空 间 ( 或 4 的 核 ). 
4 的 秩 就 是 jv (及) 的 维 数 , 即 
rpA=dimu(A). 
线性 空间 理论 中 一 个 基本 事实 是 
Al1l n=~dimu(A)-+dimN(A). 
注意 到 只 要 4 与 已 可 乘 ,就 有 
uAB)Cn( 4). 
由 A.1.1 不 难 推出 
AT rpAB=~—riB-dim(u(B)NN(A)). 
当 rh 4 一 m% 称 4 清 列 秩 , 当 rh 生 一 rp， 称 4 满 行 秩 ， 了 了 


让 示 p 阶 单位 阵 ， 我们 有 

”A.1.8 (i)4 满 列 秩 所 存在 4 满足 44=T，, 称 A 和 ,为 和 4 
的 左 逆 (ii) 4 满 行 秩 存在 4, 满足 44, 一 I,, 称 妇 , 为 和 4 的 
右 逆 . 


A.2 
设 ,9291 .Ya 是 Br 的 子 空间 .定义 -2 与 -Ys 的 和 空间 和 
列 空 间 分 别 为 
20 十 .2 一 fa 二 Bu， BER, UE LA:, VELs), 
LN La {UU EL BUELLat. 
当 如 站 .Ys 一 {0} (0 为 零 向 量 )， 称 .如 十 -2 为 直 和 ， 记 为 人员 
» 99 8 


-Ya， 因 为 有 

AL ddim (Lt Lo) = dm Litdim Ls — dim (Ai 
-La)。 推论 得 

dim( 中 一 dim 十 dm 

如 果 《1, Ts) Se WII = 0 VREY,, i—1,2, 
则 称 -名 与 -2 正 交 , 记 为 .2 | .22. 

A.2.2 2 .0 一 2 思 十 4 一 2 中 2 称 为 正 交 直 和 , 或 记 
为 5 十 .Ga. 

了 的 正 交 补 ( 空 间 ) 是 

LI={U UER, UL}. 
A.2.3 YI1=Rr， 即 乡 与 .+ 互 为 正 交 补 空间 , 
A2%4 CELLiIOL., 


A.3 | 
线性 方程 4w 一 8 相 容 (有 人 解 ) 的 充 要 条 件 是 下 列 之 一 ， 
A3.1 bEn(A):; 
A.3.2 cA-0>cb—0, 

A.3.8 rt(A:b)—rbA. 


A.4 

设 和 4 是 nn 阶 对 称 方 阵 , 则 4 的 特征 值 都 是 实数 , 将 它们 从 大 
到 小 排列 为 

和 A> 
A.4.1 设 4'=4, 存 在 正 交 阵 忆 满足 
CAC=—AEdiag(h, .…, h,). 
这 里 diag (和, ;9) 是 以 为 ,…, 和 % 为 顺序 主 对 有 角 元 的 对 有 角 阵 ， 
并 且 , cy(C 的 第 7 列 ) 是 盘 的 相应 于 入 的 (单位 ) 特 征 笛 量 , j=1， 
…, mn， 此 时 易 见 生 有 谱 分 解 
= ZINC0. 

A.4.2 设 和 4, 4 的 特征 信 有 如 下 极 值 表示 

ea 300 4. 


一 max Ww'4z, 在 如 一 ci 达到. 


Ixl=1 


一 inag 外相 ww, 在 人 VC 达到 ,一 2,…,%n. 
Nrl=1,x LHC sos) 


A.4.3 设 A'~A4A, U 是 列 正 交 阵 , 即 避 满足 UU= 了 工 . 则 
nxPp 


,Lax tAUDU~33%, 在 U= (cr…cy) 达 到 ， 


以 上 c: 均 指 生 的 第 i 个 特征 向 量 ， 

A.4.4 设 A4'= 有 和 ,下列 命 题 等 价 

(i) 有 4 的 特征 值 和 1 之 … 宕 和, 宇 0; 

《ii w’Aw>0 Vi EER", w+A0; 

Gi) 记 ? 一 rb4, 存 在 矩阵 旦 使 得 4=BB’， 此 时 , 称 委 为 
非 负 定 阵 , 记 作 有 4 二 0. 

在 上 述 ()、( 让 中 将 记 0 改 为 >>0, 在 人 i) 中 附加 7&8 一 nm, 则 
得 正定 阵 4 的 刻 划 , 记 为 4>>0. 

A.4.5 4z0 一 存在 唯一 的 非 负 定 阵 


王 1 
A¥aCAiC 
使 得 4 一 A3. 4A5， 这 里 C 如 A.4.1. 
A4.6 BB'-DD(p<mSB=-(C:0)U, 其 中 U 是 % 


x nxXD 
阶 正 交 阵 . 
A.4.7 reBB'=rtBh. 


ASG 
将 4 和 至 前 分 为 


La “*" A Bi 机 Br 
4A-| : : ) B=-| : : 
4 2 pe Ba a Be 


并 且 满 足 .4; 和 BB, 可 滋 ， 儿 一 十 ， “ p; 4 一 二 人 i=1, “ee 0. 
则 有 


Ci 机 Cr 
ABaC=| : : 
Ca Cy 


其 中 C= AuBo, 2 一 十 ， "yg 2 9 一 二， "py 人 | 
A.5.1 设 
1 A 
4-( 全 4 和 Au 是 阶 方 阵 , $= 1 2. 
21 29 


Gi) 如 4 可 道 ,有 det4 一 det4itdet( 4 一 4o4iiL4dis)i 
《ii) 如 Ans 可 逆 ， 有 det 4 一 Getdss.det(.4i: 一 .Wy py 
当 4 可逆 ,有 


了 2 0 4 A Jo 一 4i14is 
一 骨 s 人 这 站 的 4 ( 0 J,a ) 
A 0 
( 0 A As ADA ) 
故 当 4 可 道 时 有 


a-|( Li 0 | | A 0 ) 
AuAii J 0 Ass— A An A 
x ( lI: AiiAs ji 
0 Ts 


1 A! 
记 4- ( A21 A?2 ) 有 


AT— Aii+ Aii A (Ano — As ATT A1s) -1A A 
2 一 一 4 一 ai -1 
3 一 一 (4 一 04) AA 
| = (A,, 一 424 这 44) 
当 4 可 道 时 , 有 类 似 结论 . 
A.5.8 设 4>0, 放 分 如 A.5.1 4 如 人 .5.2, 则 有 A411 一 
有 说 之 0, 且 有 


+ 803. 


A 0 — AiA, — AiiAis ) 
-上 393 > 
4 ( 0 0 ( I )4 ( 1 /> 


A.5.4 设 如 是 mxm 阶 阵 , 吾 是 wxm 阶 阵 ， 则 由 A.5.1 
计算 


A 
可 得 det(N\I, - AB) 一 A-"det(A\L,— BA)， 因 此 
BB 与 如 4 有 相同 的 (包括 重 数 ) 非 零 特征 值 , 


det L 了 ) (A0 
8 AL, ) 


A.6 
设 CR" 是 线性 空间 、， 如 果 m 阶 方 阵 Ps 满足 
Px VE PA=0 YE 和 FL， 
则 称 也 是 到 .2 的 正 投影 阵 . 
A.6.1 设 4 是 满 列 秩 阵 ， 使 得 (4)= 必 , 则 有 到 人 的 正 


投影 阵 
Po— ACA’'A)-1A’. 


设 如 满足 4(B)= 儿 ,可 记 PyaP,. 

A.6.2 忆 是 到 jw(P) 的 正 投 影 阵 的 充 要 条 件 是 下 列 命题 中 
的 任 一 个 : 

(i) 户 是 对 称 罕 等 阵 ， 四 

(ii) |w— Pxl’= minlz— Pil? VWER* 成 立 ; 

(iii) P= P, 并 且 有 |Pxl<iw| YEwER" z 

(iv) 存在 正 交 阵 加 使 得 

P= oo oD’ r=7kP. 

记 UVU=(Us": 0), 得 P=U0i, 且 有 i= 了 ( 即 纪 的 r 个 
列 向 量 构 成 了 (本 ) 的 正 交 规范 基 .) 

(V) 4-P 是 对 称 短 等 阵 . 

A.6.3 设 忆 是 到 jw( 生 ) 的 投影 阵 , 则 I 一 已 是 到 jw (4) 的 
投影 阵 , 常 简 为 二 4。 


*.303 


A.6.4 设 A,B 是 n 阶 对 称 阵 ,C 一 4+B 寡 等 , 则 有 
(i) 4, B 是 罕 等 阵 =>4B-0， 
(ii) 4 宕 等 , 5>>0=>B 寡 等 . 
A.6.5 设 2, .2 是 嫩 的 线性 子 空 间 , 则 下 列 命题 等 价 : 
(i LD Ls 
(i) P,P ,>0, 
(ii) 天 > 天 一天; 
(Gv) PyP,.=P,. 
且 当 上 述 任 一 条 件 满足 时 ， 
Ps- P=—P ,no 
是 到 各 站 .ZZ3 的 正 投影 阵 . 
对 于 本 附录 的 证 明 , 可 参 着 倪 国 钻 《 常 用 的 矩阵 理论 和 方法 »， 


习 题 、 


TI. 假设 我 们 观察 模型 
Y=Bot Pim. Por? +e. 
其 中 8; 独立 日 遵 从 入 (0, o?)， 得 观察 数据 


试 求 B=(6 B63，Ba)' 与 3 的 极 大 似 然 估 计 . : 
2. 设 Y 二 (4, ya， yo) 满足 线性 模型 (XB,，o31)， 
ECy:) -= Bo Bix; 十 局。 《3xz; 2), i=1, 3, 3. 


其 中 对 = 一 1 x2 一 0, x3 二 1， 写 出 ZX 并 求 (Bo, Bl:，Be)' 的 最 小 一 乘 估计 . 
3. 荣 职 工 医院 用 光电 比 色 计 检 验 尿 求 时 , 得 尿 汞 含量 (mg/1) 与 消光 系 
数 读数 的 结 浊 如 下 : 


屎 示例 基 (2 
消光 系 六 1) 64 
已 知 它 们 之 浊 骤 从 线性 模型 
Ey; = Bo Bix, 
试 求 Bo 和 Bi 的 最 小 二 乘 估计 , 并 检验 Bi 是 否 为 零 (c 一 0.05)9 


se304。 


4. 下 而 记录 了 一 批 紧 儿 出 生体 重 与 6 个 月 时 体重 的 数据 . 试 估 计 它 们 
之 间 的 相关 系数 和 回归 直线 . 


身 2,75 一 
体 3.00 一 
重 3.25 一 
{Eg} 3.50— 
3.75— 


4.00— 


合 计 


5.， 对 三 种 不 同 品种 的 小 麦 , 施用 四 种 不 同 的 肥料 所 获得 的 产 昌 (每 块 按 
磅 计 ) 如 下 表 . 


试 检 验 三 种 不 同 小 下 的 平均 产量 柜 等 的 假设 和 四 种 肥料 等 效应 的 零 假设 ， 
6， 下 面 记录 了 三 位 操作 工分 别 在 四 台 不 同 机 器 上 操作 三 天 的 日 产量 : 


操 工 


作 


甲 之 夫 
15, 15, 17 19, 19, 16 16, 18, 21 
17, 17, 17 15, 15, 15 19, 22, 22 
15, 17, 16 18, 17, 16 18, 18, 18 
18, 20, 22 15, 16, 17 17, 17, 17 
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试 检验 : (1D 操作 工 之 间 的 差异 是 否 显著 ? 
(2) 机 器 之 闻 的 差别 是 否 显著 ? 
(3) 交互 影响 是 否 显著 (a 二 0.05)? 


Art 工 了 Hi GO7? fools) 
7. 设 (、 )~N: (人 La ) (ee 03 )) 
求 出 了 对 际 的 回归 y=B(Y/x) 和 了 对 了 的 回归 x%=B(X|Y)， 观察 这 两 
条 回归 直线 是 否 一 致 

8. 线性 回归 模型 4V=XRB+B Var(8) =o2I 刁 为 2X2 和 矩阵 ， 秩 为 P。 
证 明 ; 在 入 个 试验 点 的 预测 误差 的 方差 之 和 为 (mm 十 )a3. 

9. 试 证 引 理 6.1 的 必要 性 ，( 提 示 : 证 全 的 必要 性 时 要 用 特征 函数 ， 证 
(让 的 必要 性 时 要 注意 到 利用 B 的 线性 无 关 的 列 ，》 

10. 设 总 体 满足 模型 y=Bo 十 BX+s， 在 试验 点 (tot，…， zap) 上 得 到 观 
察 值 ya，& = 二 1，…, 2. 证明; 在 (6， 18) 中 以 样本 矩 代 Bo 全 BY— gy wr DrxBEX, 
BS 35fkaxr 中 的 总 体 矩 , 所 得 结果 记 为 Bo， 忆 与 (6.28) 中 用 最 小 二 乘法 所 
得 回归 系数 Bo, B， 完 全 一 致 . 

11. 试 证 : 在 回归 分 析 中 对 于 假设 (6.38) 的 检验 ， 与 自 变量 因子 的 尺度 
无 关 , 即 车 设计 矩阵 的 某 列 乘 以 常数 a, 检验 统计 量 也 =B3/ (ess) .Cs 一 由 并 
未 改变 ， 

12. 证 明定 理 6.4 的 系 . 

13.， 证 明定 理 6.9. 

14， 试 证 : 在 模型 (6.51) 中 钦 使 参数 函数 局 88, 可 估 , 充 要 条 件 是 包 局 
一 0.，( 称 这 样 的 参数 函数 为 因子 水 平 效应 的 对 照 . ) 

15. 证 明 (6.64) 给 出 的 启 是 模型 gy~ XB, o2G) 中 B 的 GM 估计 . 因 
此 , 一 般 地 说 , 在 模型 y~ (XB,oG) 中 B 的 最 小 二 乘 估计 和 不 再 是 BLUUE. 
如 果 假 定 和 满 列 秩 , 你 能 给 出 此 时 的 和 仍 是 BLUEB 的 充 要 条 件 吗 (用 六 ，G 
表 出 2? 

16, 设 g= 二 XB+£，Cov&8 二 03G, 证 明 ， 

(1) Es' A ~=otrAG 

(2) 当 8 正 态 , 有 D(8'A8) 20trAGAG 

17、 把 下 面 两 个 估计 问题 纳入 线性 模型 的 范围 ，(a) Xt，…，, 是 从 
N (a, co?) 中 的 ia， 样本 , 估计 ea。(b) 五, …，Xm 和 了, …, 了 是 从 NN (a, 
0 入 (5b, po 中 取出 的 iid， 样本 ,p 已 知 ,估计 9, 5. 

18， 线 性 模型 y 一 娘 B+8，Var(e) =o%%， 为 了 AY 为 o? 的 无 偏 估 
计 , 4 应 满足 什么 条 件 ? 


+ 306 。 


19 . 设 观察 值 级 ， "Yn 与 参 数 启 ， "yg Be 的 正 祖 关 系 十 线 性 模 
型 y~XB+e 一 (Xs ; Xo) ( 8? ) 十 B 而 我 们 由 于 不 了 解 ， 或 为 计算 简便 计 ， 


采用 了 模型 9V=XoB。-Hs， 设 (X5XKo)-1 存在 。 设 我 们 从 后 一 模型 中 算出 了 
Bp 的 LS 估计 B66。， 问 Bs 为 By 的 无 偏 估 计 的 充分 必要 条 件 是 什么 ? 解释 这 
些 条 件 的 意义 。 

20。 斌 证 对 模型 (6.53) 附 加 的 约束 条 件 (6.54) 满 足 (6.74) 和 (6.76)， 
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第 七 童 多 元 分 析 基 础 


在 本 章 中 将 集中 讨论 多 指标 的 统计 分 析 问 题 ， 按 照 习惯 称 这 
一 分 支 为 多 元 统计 分 析 , 简称 为 多 元 分 析 ， 

在 实际 问题 中 ,我 们 往往 对 对 象 的 多 个 指标 感 兴 趣 ， 例 如 ; 在 
天 气 预 报 中 ， 要 同时 预报 气温 、 气压 、 风向 , 风力 及 降水 等 多 项 指 
标 ， 在 检查 人 体 的 健康 状况 时 , 需要 检查 体温 血压、 肺活量 .脉搏 
以 及 血液 等 各 方面 情况 ; 在 分 析 矿 石 标本 时 , 我 们 将 关心 它 所 含 的 
种 种 元 素 和 化 合 物 ， 总 之 ,在 这 类 问题 中 , 我们 要 观察 取 自 总 体 的 
个 体 的 多 个 指标 值 , 得 到 多 维 的 样本 观察 值 , 在 此 基础 上 进行 统计 
分 析 . . 

在 上 一 章 讨论 回归 分 析 的 时 候 ， 虽 然 也 涉及 多 个 随机 变量 的 
情形 ,但 那 时 我 们 将 某 个 随机 变量 看 成 因 变 量 , 而 将 其 余 视 作 自 变 
量 . 突出 了 对 一 个 指标 的 关心 ， 在 本 章 的 多 元 回归 分 析 中 ,我 们 将 
拒 多 个 随机 变量 当 作 因 变 量 ， 讨 论 一 组 随机 变量 对 另 一 组 随机 变 
基 的 依赖 性 ， 从 而 可 见 这 里 所 说 的 多 元 统计 分 析 与 一 元 统计 分 析 
的 分 野 ， 当 然 , 在 某 些 情况 下 , 这 种 区 分 并 不 是 很 严格 的 , 也 可 能 
并 不 重要 . 

在 实际 生活 中 需要 关心 多 指标 的 情形 ， 明 显 地 更 为 常见 ， 尤 
其 是 在 地 质 、 气 象 . 生 物 、 经 济 、 军 事 等 领域 , 免 下 了 要 和 许多 指标 
打交道 ， 因 而 多 元 分 析 有 十 分 广泛 的 应 用 价值 . 

近 二 十 多 年 来 , 多 元 分 析 发 展 迅 速 , 普及 甚 广 , 其 推动 力 固然 
是 实际 需要 , 也 离 不 开 计 算 机 的 飞 轻 发 展 及 普遍 使 用 。， 在 统计 分 
析 中 , 随 着 指标 的 增加 , 不 但 问题 变 得 更 为 复杂 , 而 且 计 算 量 将 大 
大 增加 , 况且 统计 分 析 常 常 有 时 间 上 的 紧 追 性 (如 天 气 或 地 震 的 预 
报 ), 如 果 没 有 高 速 . 大 容量 的 计算 机 ,很 难 想像 能 及 时 作出 分 析 结 
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果 . 为 了 提 癌 计算 的 效率 ， 多 元 统计 分 析 将 更 多 地 依赖 计算 机 算 

另 一 个 什 得 注意 的 情况 ,正如 MM. Kendell 在 < 多 元 分 析 ? 一 书 
的 序言 中 所 说 “因为 多 元 分 析 这 门 学 科 正 在 发 展 之 中 , 它 虽然 是 一 
门 科学 , 但 也 可 看 作 是 一 种 艺术 。 这 段 话 意味 着 多 元 分 析 方 法 的 
不 确切 性 和 灵活 性 . 它 可 以 从 两 个 方面 来 理解 : 一 方面 , 多 元 分 析 
理论 还 很 不 成 熟 ， 尽 管 从 各 个 角度 提出 了 不 少 可 以 使 用 的 统计 方 
法 ,但 这 些 方法 尚 缺 乏 充分 的 理论 依据 ,对 所 得 结果 也 往往 难以 作 
出 较 完 善 的 统计 解释 ; 另 一 方面 , 由 于 多 元 统计 问题 的 复杂 性 和 不 
确定 性 ， 要 从 理论 上 给 出 严 间 系统 的 方法 ， 至 少 在 当前 还 很 难 做 
到 ， 

作为 数理 统计 基础 教程 中 的 一 章 ， 远 远 不 能 容纳 多 元 分 析 的 
丰富 内 容 . 我 们 的 目标 是 给 出 多 元 分 析 的 最 基础 的 理论 ， 并 讨论 
一 些 常 用 的 在 理论 上 较 有 根据 的 方法 ， 使 读者 能 从 中 窥见 多 元 分 
析 之 一 更 。 至 于 多 元 分 析 中 很 重要 的 算法 问题 ， 就 唯 有 忍痛 割爱 
1. 


$7.I 多 元 正 态 总 体 的 抽样 分 布 及 参数 推断 
如 同 在 一 元 统计 分 析 中 相仿 ， 正 态 分 布 在 多 元 统计 分 析 中 也 
起 着 基本 作用 。 由 于 推导 多 元 统计 量 的 分 布 困难 更 大 , 在 多 元 分 
析 理 论 中 , 凡 涉 及 到 需要 给 出 统计 量 分 布 的 场合 ,几乎 都 是 在 假定 


总 体 有 多 元 正 态 分 布 的 基础 上 展开 的 。 因 此 ,本 节 所 介绍 的 理论 ， 
无 疑 是 多 元 分 析 的 必要 基础 . 


《一 ) 多 元 正 态 分 布 及 其 基本 性 质 
我 们 所 熟知 的 正 态 随机 变量 到 ,一 般 有 密度 函数 为 
f(z)= (oxo oxp| -sc 一 由 对 (7.1) . 
其 中 jo, 0? 分 别 为 开 的 均值 和 方差 ， 记 四 ~ 条,(jp，o， 正 六 
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随机 变量 的 分 布 由 它 的 均值 和 方差 完全 决定 . 
如 时 下 2 ” 全 是 来 自 正 态 总 体 Nn, 0 ) 和 的 随机 样本 ， 那 
么 及 一 0 部 中 的 密度 函数 是 


Jo wo) 一 (3mo9) Eoxp| — BH 


2C3 


ie-o? 
(7.2) 
这 里 的 p 维 随机 向 量 了 被 认为 有 Dp 元 正 态 分 布 .但 是 ,值得 注意 
的 是 一 般 的 多 元 正 态 分 布 ,并 不 总 有 密度 函数 ， 有 形 如 (7.2) 的 密 
度 函 数 的 , 只 是 其 很 特殊 的 情形 。 为 此 , 我 们 给 多 元 正 态 分 布下 一 
个 确切 的 定义 , 然后 讨论 它 的 一 些 基本 性 质 , 

定义 7.1 

设 下 =《Xi ,站 ) 是 2 维 随机 向 量 . 如 果 对 任 一 2 维 实 向 
量 QE Rr, 都 有 和 是 正 态 随机 变量 , 则 称 及 是 2p 维 正 态 (随机 ) 
向 量 , 称 二 的 分 布 为 p 元 正 态 分 布 . 

记 及 的 均值 向 量 如 下 为 凡 记 下 的 协 方差 矩阵 ov 下 为 五 
下 面 的 附注 将 说 明 及 的 分 布 被 p 和 辫 唯一 决定 ， 因 而 可 记 四 一 
Nu 之 )。 注意 我 们 并 没有 假定 之 是 可 逆 阵 , 

附注 7.1 pp 元 正 态 分 布 可 以 用 许多 种 等 价 的 方法 来 定义 ,这 
些 等 价 条 件 都 称 作 正 态 分 布 的 刻 划 (Charaterization)。 鞭 中 最 重 
要 的 一 种 就 是 用 特征 函数 ， 一 般 概 率 论 教 科 书 中 都 给 出 了 随机 变 
量 斑 的 特征 函数 的 表示 式 为 Be'X, 正 态 随机 变量 全 ~Ni(j, ca3) 


的 特征 函数 是 axp| int 一 去 os。 随机 向 量 站 的 特征 函数 定义 
Prt) = BetX, (7 .8) 
它 是 =( 刀 ,…', 刀 ) 的 函数 ”根据 特征 函数 的 道 转 公式 ，$px(t) 
唯一 地 决定 苦 的 分 布 婧 数 、， 设 在 是 正 态 随 机 向 量 ， 玉 ~ 入 ,Cp， 
3)， 对 于 tE 9, 有 站 革 是 正 态 随机 变量 , 它 的 特征 函数 应 当 是 
$(0) = Botex exp|i9t' 了 ~ 十 DK 
注意 到 Bt X= EA=tp, DE XR)=t Cov Rt=t Dt, 
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二 是 在 8$(09) 的 表达 式 中 取 8~1 就 得 到 
owx exp 斌 入 一 训 ei. (7.4) 
这 正 是 芷 的 特征 函数 ， 它 由 jk 和 之 所 决定 , 故 可 断言 正 态 问 量 
的 均值 jk 和 协 方差 隆之 唯一 地 决定 了 它 的 分 布 . 
如 果 恋 者 缺乏 特征 函数 知识 ， 可 以 只 接受 附注 的 结论 而 不 顾 
其 理论 推导 . | : 
下 面 是 多 元 正 态 分 布 的 基本 性 质 ， 
性 质 1 正 态 随机 向 量 的 线性 函数 必定 是 正 态 的 、 设 有 至 ~ 
om 之 ): 和 是 任 一 gxp 阶 的 实 矩 阵 ,2 是 9 维 实 向 量 ,那么 
YaAX+b~N (Aptb, A5A). (7.5) 
证 任 给 aE Rr, 有 GT 一 ac 4 下 Ta'5， 因 4 下 是 正 态 变 
量 ,G2 是 常数 , 知 @' 王 是 正 态 变量 , 因此 开 是 正 态 向 量 . 其 余 显 
然 . 
性 质 2 对 于 任 给 的 Pp 维 实 向 量 上 和光 阶 非 负 定 方 阵 之 ， 必 
存在 正 态 随 视 向 量 王 以 为 均值 向 量 , 以 为 协 方差 矩阵 . 
证 由 第 六 章 附录 ， 知 2 有 分 解 式 2 一 44.。 取 Pp 个 相互 独 
立 的 标准 正 态 随 机 变量 了 1,…， 了 ,, 记 了 一 (了 Yi, …, 了 9g)', 则 有 工 
~ 和 Wp(0, 了 ,). (看 (7.2)) 令 研一 第 了 +, 由 性 质 工 立 得 
下 No， AA)— Nolp, 2). ”证 毕 . 
这 一 证 遇 实 际 上 蕴涵 了 下 面 的 
性 质 3 任 一 p 维 正 态 随机 向 量 ， 可 表 为 zp 维 标 准 正 态 向 量 
(~ 和 ,C0, 了 ) ) 的 线性 函数 . 
性 质 和 4 设 症 ~NsCj, 忆 ), 如 果 之 正定 ( 因 之 原 是 非 负 定 阵 ， 
只 需要 求 其 可 逆 就 够 了 ), 称 下 是 非 退 化 的 。 些 时 ,下 有 密度 函数 
jw) 一 (mr 到 (det3) oxp{- (wp) De—p)}. 


(7.6) 
证 用 性 质 8 给 出 及 ?了 pp，Y~N,(0,，)， 由 (7.2) 
知 了 的 密度 函数 为 
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f(y) =(2m) foxp{- 训 yy} 
作 变换 J 一 加 (zw 一 Jj), 知 Jacobi 行列 式 是 det 罗 了 ， 因 此 了 ( 玉 ) 
的 密度 函数 如 (7.6). 
从 性 质 和 的 证 明 可 以 看 出 ,如 果 写 奇 异 ,那么 变换 w 一 避 3y 十 
到 不 是 一 一 的 ,积分 变量 替换 将 无 法 进行 ， 这 时 下 的 分 布 函数 是 
P(e) = | sf (Wdy, (7.7) 


但 不 再 存在 密度 函数 ， 其 中 a<b 表示 wi < bs, 8 一 十 ， ”人 
性 质 5 设 晨 ~NW,(Cp, 之 )， 相 应 地 作 如 下 前 分 
2 入 
于 二 (1) ) (ee = 41 ?| 
( 在 (9) Kc) \ Do 之 aa 
其 中 生 6, 是 p, 维 的 ， % 一 二, 2, Di 十 Pa 一 pp， 则 有 
1” 如 果 之 a= 之 一 0, 则 有 下 人 与 症 () 独 立 ; 
2” 如 果 11 可 道 , 则 在 给 定 至 co 时 量 (w 的 条 件 分 布 是 
人 (Ra 十 访客 (0 一)), 之 sa 一 之 al 之 训 之 jp)，(〈7 .8) 
当 之 s 可 道 ,有 类 似 的 结论 ， 
证 1 用 性 质 4 证 明 中 的 方法 从 (7.7) 式 不 难 给 出 证 明 ( 用 


特征 函数 更 易 看 出 ), 留 给 读者 作为 练习 . 
2” 的 证 明 如 下 : 令 


I 0 
p-{ ww ) 
人 -BB 五 


作 变 换 了 一 PX, 则 有 


"| 

大 (9) 一 写 912i) Y'», 

> 0 ) 

0 oo — Bodii Es 

1 了 0 与 Fs, 独立 。 因此 了 (== 苦 () 分 定时 ， ea 的 条 件 分 布 
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OovF= PCovXP’'— ( 


也 就 是 了 oo 的 边缘 分 布 , 故 有 

Yoy~ Ny — Zod ho, Das— ZaiZii Za). 
但 尝 (s, 一 了 (wy 十 本 s1 久 这 这 u)， 得 蔡 ) 给 定时 半 ) 的 条 件 分 布 如 
《7.8) 式 ， 证 毕 . 

性 质 5.1° 表明 不 相关 的 正 态 随机 向 量 站 了 〈 即 满足 
Cov (及, 了) =0) 一 定 是 独立 的 . 反之 当然 也 成 立 ，2° 的 特殊 情 
形 py 一 p 一 1, ps 一 1 在 多 元 分 析 中 很 有 用 ， 从 (7.8) 可 见 着 u) 给 定 
时 及 o 的 条 件 均值 是 过 0 的 线性 函数 , 这 正 是 讨论 一 元 统计 时 对 
正 态 总 体 的 回归 所 得 结论 的 推广 ,在 多 元 回归 中 亦 将 起 重要 作用 。 


(二 ) 正 态 总 体 的 抽样 分 布 
设 总 体 G 有 了 元 正 态 分 布 Wo(, 之 )、 wi,…, wr 是 取 有 目地 
的 简单 随机 样本 , 即 有 
Ta~ Np, 2D), Cov (ga, Ta) =0, B, au 一 1 %, Bao. 


NX1 
记 太一 | : | 
wn 


我 们 来 研究 随机 和 矩阵 过 的 分 布 。 记 2 一 (2 2， 易 见 五 w' 一 
(xp 且 有 
/BD 0 
Covw 一 | … | 
(3 


可 见 遵从 wp 元 正 态 分 布 ， 设 之 一 B'B, 由 (一 ) 性 质 2, 存在 由 
相互 独立 的 标准 正 态 变量 zy(~ 入 (0, 1)) 为 元 素 的 矩阵 如 ,使 得 
=-ZB+-M, M= BX. 
. 将 上 述 情形 推广 到 了 ~=AZB+ 肝 ”这 里 Z=(zwy) 是 nxp 

阶 随机 阵 ,%y 相互 独立 遵从 六 (0, 1), 入 是 mxn 阶 实数 阵 , 召 是 
2X9 阶 实数 阵 , 用 是 mxg 阶 实数 阵 , 且 记 44’=V=(vy), B'B 
一 祈 = (ow). 显然 ,将 了 看 作 m9 维 向 量 , 有 二 遵从 mg 元 正 态 分 
布 。 计 算 可 得 
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Du)=D 2 Wiazapd si) 一 之 Ciu2b 一 之 Cio DD — Vio 
Cov (yy, Yrn) 一 COV (之 Gaga6paj 之 yataaD ph) 
一 > iab pidrab 
一 OOz， ,b=1, ,mm; h, j=1, -…, g. 
因此 王 的 一 、 二 阶 和 矩 仅 依赖 弄 , 下 和 之 . 记 
| Y~Nro MM, VV, 之 ). (7.9) 
于 是 有 前 面 的 -对 ~ 和 Nw(MM, 了 这) 在 多 元 统计 分 析 中 ,我 们 仅 限 
于 讨论 如 (7.9) 的 矩阵 正 态 分 布 . 
定理 了 .1 
设 了 ~Nm( 了 MT, 号)， 任 给 C, 了 D 分 别 为 xm 阶 和 gx” 
阶 实 阵 , 则 有 
-=CYTD~Ne CHMD, CTC D2D). 
证 明 是 容易 的 , 留 作 练习 。 
作为 一 元 统计 中 x 变量 的 推广 ,我 们 研究 
W= XK, ~N,pM, 了 2), M = (pp) 
的 分 布 ， 这 类 随机 和 抢 阵 的 分 布 , 习 惯 上 称 Wishart 分 布 ， 它 的 密 
度 函 数 问题 比较 复杂 , 本 书 不 予 讨论 , 但 有 必要 研究 它 的 一 些 重要 
性 质 , 
我 们 不 难 验 算 


EW:= > Erar'—nZ + MM 


-其 中 二 重生 (pp)， 

记 4~= 隆 人 M, 通 过 不 让 此 给 出 的 推理 ,可见 一 个 遵从 Wishazrt 
分 布 的 随机 矩阵， 从 分 布 的 角度 而 言 ， 仅 仅 依赖 于 w, %, 全 和 4. 
称 2 是 琴 的 维 数 ,” 是 自由 度 , 之 是 所 依赖 的 协 方差 矩阵 , 4 是 非 
中 心 矩 隆 , 记 了 斥 的 分 布 为 

Wn, SZ, 4A) 

全 称 为 p 维 的 基于 协 方差 矩阵 安 的 自由 度 为 mw、 非 中 心 矩 阵 为 4 
的 Wishart 分 布 。 简称 为 Wishart 分 布 。 依 4 是 否 为 零 而 称 
a。 34 。 


中 心 Wishart 分 布 和 非 中 心 Wishart 分 布 。 如 果 一 个 随机 和 矩阵 
可 表 成 (7 .9) 的 形式 , 就 认为 它 遵 从 克之 ， 人 分 布 。《〈 注 意 此 
分 布 仅 依赖 4=MM.) 
定理 了 .2 
设 W~W,n, 之 ， 4), 则 有 
1。 如 果 p 一 1, 2 一 03, WW~o2( 人 /0); 
2” 设 委 是 任意 的 xp 阶 阵 ,有 
AWA’~W,n, AB5.4’, AAA’). 
证 1° 是 显然 的 
2° 记 了 了 =A 有 = (gi…g,), 易 见 
Ya~~Nx (Ajpa， 妥 名 A) 旦 相互 独立 ,a==1,，…，%， 因此 
AWA'=YY~ Wn, 454A', 444') 得 证 
定理 了 .3 
设 下 ~ NE 耳 , 写 ), C=C', 则 有 
1° Wa 下 CC 玉 和 ~WW,(h, 五 MICM) 0 为 正 投影 阵 , 7hC=b 
2°4A 有 与 BB 独立 今 AB'=0; 从 而 有 : B>0, 4B=0 推出 
和 四 与 玉 B 有 独立 , 4>0, B>0, 4B0 推 出 及 A4 四 与 荆 BX 
独立 ， 
证 1 >” 对 一 切 g€EBR?, 有 Qa Wa~xs(5), 得 C 为 正 投影 
阵 .“<=” 存 在 中 满足 C=UU', UV'U-J, 令 ~ UX, 记 U= 
(tr…ts) 有 | 
Oov( 下 2， 是 1) 一 Cov 2 Valia, 之 wotei) 
5S, j=)j, 
0, % 关 
于 是 下 CC 及 = 了 YY 了 而 Y~Nrp(U'M, 了 马 ), 得 证 . 
2° 的 证 明 可 由 对 一 切 3 
Cov (Swudia, SRabja) = Twabia = AB'~0, 得 到 . 
定理 7.4 ” 
设 W~Wytn, ,A 人, n>p, 也 >>0. 则 有 
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P(W>0)=1. (7 .10) 

证 按 定义 有 琴 一 下 县 ,下 ~ 一 Noo(N T, 22), MM=4, 记 
及 一 (wi---ww) ,对 五 <p, 由 正 态 分 布 性 质 5 得 : 当 ea，…，wm 
给 定时 , wer 的 条 件 分 布 是 入 (ppys，o%41 了 1), 这 里 a8ti 一 64( 写 3 
一 之 31 之 这 忆 i)el, 其 中 ei 一 (10…0)。 因 此 条 件 分 布 非 退 化 , 故 有 

Plwoy Em TD, , Won) [Wen, **, Lo) —0. 

这 是 由 于 p(wo,…', oo) 至 多 是 万 维 子 空间 , 而 Xrs 是 mn 维 的 ， 
县 条 件 分 布 非 退化 ， 从 而 有 

P(ry EN(ZeD，…， Ton) ) 

=E{P(wen ENRD, , Ton) | Wn, *, Wo)} =0. 
于 是 了 P(rhk 久 <<p) 一 (wo),…， Ww 线性 相关 ) 
< 多 PvE pw, ,Wm)) = 0, 

因此 有 三 (下 "下 >>0) 一 二 得 (7 .11). 

根据 定理 了 .4， 当 m 关 D 五 >0， 只 要 忽略 一 个 概率 为 零 的 事 
件 ， 就 可 认为 殉 是 可 道 的 ， 称 琵 有 非 退 化 Wishart 分 布 。 当 
%< 力 或 det 妇 一 0, 称 证 有 退化 的 Wishart 分 布 . 

作为 0oohran 定理 到 “矩阵 二 次 型 "的 推广 ,有 


定理 了 .5 
设 互 ~ No( Nd L 之 )， 4:， "pg 4.>0, 满足 


重量 二 SS 4, 记 7hA=n 
则 A XW B, MAM), i=1, -…, je 一 袜 rm 
证 明 可 从 @' 卫 ' 玉 a 推出 ， 留 作 习 题 , 
引 理 7.1 z 
设 玉 和 ~Wj(w, 轨 ), mn 之 p, 思 >0. 将 玉 和 驴 相 应 地 前 分 为 


Wi WW ( 之 1 2 
于 = ,如一 
Ws W,», 之 1 p> 
其 中 全 3 可 1 为 9 阶 方 阵 ， 记 Ws= Wu— Wy Wa Ws, Suns 
pp rp 则 有 
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Wa ~ Wan, 之 sa) ， 在 W's 给 定 的 条 件 下 
CWaa Ws | Weg) ~ Ny,-a, a E22 2a, Wi, 之 11.5)， 
(Wal CWsz Wa, Ws)) ~ Wakn— 2 十 9， 之 it) 不依 
赖 ( 丈 3:， 环 sa) . 
证 在 定理 7.2.2° 中 , 取 
如 = (6 0 } 立 得 Woo~ Wo-aln, 230). 
0 7-。 
设 W=— 半 站， ~ NN,(0, L, 之 )， 记 皮 = (Xi, 疏 3)， 这 里 下: 
有 9 列 . 因 玉 的 行 独立 同 分 布 , 由 正 态 分 布 性 质 B.2”, 不 难得 到 
在 下 给 定时 入 ;的 条 件 分 布 为 
四 1| 下 3 改作 (是 39 忆 到 袜 a1， I, Zi11.3) (7.11) 
注意 到 了 丽 2 = 于 在 ;， 全 3+ 一 下 92 下， 了 2 一 下 ? 居 s 由 定理 7 了 .1 得 
Lp 
(下 ?是 9) 1， 之 li.a) ， 
知 它 仅 依赖 于 到 下 了 pa 区 有 Wis 给 定时 
Wai Wai| Waa~ Ng_g,a DZ, Wi, Zs). (7.12) 
由 于 14.9 一 上 砷 1( 了 一 昼 a( 异 5 恒 ) 胡 5) 前 1 一 慎 {PPxs 芋 ,， 
由 定理 7.3.1°, 当 于 给 定时 有 
Wi sl Eo~ Wn — pi yg, B11.2) 
〈 非 中 心 矩 阵 丰 一 写 13 之 下 是? 天 是 3 之 到 写 , 一 0). 又 由 定理 7.3.2。， 
由 (有 层 3 且 3) 至 PP 一 0 得 玫 1s 与 WH Ws 在 生 s 给 定 的 条 件 下 
独立 ,而 研 11.s 与 下 无 关 , 环 呈 Wa 仅 依 束 却 zs, 故 有 
Wa) CWaa Wa, Wao) ~ Wn~—pt+g, B12). 证 毕 . 
定理 ?7.6 
设 全 ~ 丈 ,(n, 之 ), mn 之 p, 儿 >0, 则 有 
1°” 对 任 给 的 aE Be?, 有 
a> ia > 
ne ?+t 
2” 设 Z~N5(0, 安 ), 与 玉 独立 ,有 
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ly Wig. Bt Pn_pil. (7 .18) 


-证 先 考虑 a=ei 一 (10-…0)', 有 、 
Ty ia (2) (Bi DoD)! 
aW a (Wis: ( Wi— Wi Ws Wy) 二 

Wi — Wia Waz Wo 


一 
1i™ 之 1a 22 ud 3 


一 于 
用 引 理 7.1 g 一 1 的 情形 得 -人 从- 对 QE 令 克 


一 &/ al, 作 正 交 阵 U= (ta …4p), 有 a= Ues|al, 得 
a>'a eeU2YiVe _ el(UVSU) es 
aW-ia eeUVWiUVe, eeU WU) Ye,. 
由 定理 7.2 知 UWU~Wolnm, U23U)， 放 由 已 得 结论 立 得 


Se Xn pti 对 一 切 GE BR? 成 立 . 
op Ht 


注 章 到 ww WoW 
当 w 给 定时 , 有 (这 守之 -| xz )~ 必 siz， 因此 条 件 分 布 实 际 上 
不 依赖 于 w, 得 - 才 负 52 ~ 从 -sa， 且 知 它 与 独立 ， 从 而 也 与 


人 TY 名 -1w 独立 。 于 是 有 (人 .13) 成 立 ， 证 毕 . 
记 T?~w'W!w, 称 它 为 Hotelling 了 统计 量 , 它 在 多 元 统 


计 分 析 的 假设 检验 中 起 着 重要 作用 . . 
设 取 ;~ 机, (后 转 ), 玉 s 和 ~ 形 ,(ba, 习 ), 且 琴 与 阮 独立 , 令 
det Wi 
A TW TW (7.14) 


称 4 为 Wilks 统计 量 , 它 的 分 布 仅仅 依 束 于 wp, 有 和 和 s, 记 它 的 分 
布 为 4(p, bi, hbo). Wilks 4 统计 量 在 假设 检验 中 也 很 重要 、 但 
它 的 精确 分 布 的 推 时 相当 困难 直到 1966 年 才 由 Schatzoff 求 出 . 
当 p 一 1,2, 或 加 一 1, 2 时 ,4(%p, hz, 如 ) 号 卫 分 布 有 窗 轨 联系 ， 其 
联系 见 表 了 .1. 
一 般 情形 的 4 分 布 表 (42p<8) 可 看 张 觉 庭 、 方 开 泰 多 元 统计 
。318 。 


分 析 引 论 ?>。 


表 7.1 A(p, ,ho) 与 也 分 布 (kip) 


自 由 度 


DD, Fi 一 十 1 


PD; 1 —» 


ja Kr 


219， 2 Chi 一 1) 


(三 ) 正 态 总 体 的 参数 统计 推断 
设 总 体 Q 有 Pp 元 正 态 分 布 入 ,Cj 忆 )，2，…， 是 取 自 4 
的 容量 为 一 的 简单 随机 样本 , 记 
Y= (gy,), 有 Y~ Nw (WM, I, 之) 
这 里 仙 = (jg) 
仿 一 元 统计 , 令 样 本 均值 和 样本 协 方差 阵 为 


Fl gl Gy yo) 
Y= Ya, ST Ya) Ya Y)". 

用 矩阵 记 法 有 z 
了 一 了 1 二， S-YPL.Y_t 


好 一 十” 
先 讨论 kk 和 窟 的 估计 ， 在 上 述 记号 下 有 
定理 了 .7 
多 和 仿 分 别 是 上 和 的 无 偏 合计 ， 并且, 在 的 一 切线 性 
无 偏 估计 { 了 了 a} 中 ,满足 
Cev(Y'g) 一 Govy 之 0 ( 非 负 定 ) (7.15) 
证 容易 验算 
By~ BY'l, 工 一 MT Tp. 
设 Ya 是 的 任 一 无 偏 估 计 , 有 
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BYa~ Ma qi 一 J 此 ,其 充 要 条 件 为 a 一 1。 注意 到 


oov( Fa- Y1 i Y1) 


RA 


-1H)s- 
从 而 易 见 Cov( 了 a) 一 Qov (Ya) 十 Covy, 得 
Cov(Y’a)—Covy=Qov(Y'a-)>0,. 
顺便 注意 到 ”Cov 本 = 二 习 . 
由 于 
(nDES-B yD) (ys—D)’ 
-BE(S yy ny) 
~ (SZ+pp) —n(TB+ iy) = (n—D)2, 


得 仿 是 从 的 无 偏 估计 . . 

注 记 : 定理 7.7 的 证 明 并 未 涉及 分 布 的 具体 形式 , 因而 是 不 依 
赖 于 分 布 的 . 

定理 了 .8 * 

如 果 瑟 >0, 网 (8，8) 对 于 分 布 族 {Wo(H, 之 )} 是 充分 党 
各 统计 量 . 

因此 , (y,S) 是 (jk, 写 ) 的 一 致 极 小 方差 无 偏 估计 (UMV UE)， 

证 了 的 联合 密度 是 


(YF)~0'(dt3) orp{- 计 高 (We-p Dy) 
—0. (det3) 3 oxp|- i 了 3- (ga 一 请 ) Ye pe) }. 


由 于 
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pa (Ya— 1) Ye— pH) 一 六 Vay — ng 一 六 下 np 
YY_ngp npg tnpp. 
(7.16) 


得 ”ff(Y)=0O: (dei®) 到 oxp| - tr2-+Y F+np -二 


xexp| -号 Po 

可 见 (y,， 了 了) 是 充 分 完备 统计 量 , (看 定理 2.3.) 

因为 (y, S) 是 (y， 产 了) 的 函数 , 且 是 (p， 双 的 无 偏 信 计 ， 故 
由 定理 2.2, 知 其 是 UMV UE. 

定理 Y.9 

设 了 >>0, 则 (， 到 /nw) 是 (Cp, 己 ) 的 极 大 似 然 估计 . 这 里 研一 
Y'P.Y 

证 由 (7.16), 对 于 给 定 的 马 , 欲 使 

f\Y: p, 2) 
达 极 大 ,只 需 取 应 一 从 而 有 
fF(F fh, DB)=0.(det DB) 3 exp{- 到 tr W]. 

故 得 
log 三 五 2Z)=10g O 十 可 log det 习 二 一 可 tr2Z -1W/n=logO 


一 也 Jog det W/n+ 3 (log det2 1 Wi/n 


—trZ™W/n). 
记 之 一 弄 /m 的 特征 值 为 Xz，…，xo。、 则 有 
lop det2 "1W/n—tirB i:W/n 


—Hogh ~ = Hog(+h—D) — 
<H%-1- -pp 


且 上 述 不 等 式 仅 当 加 一 1， 5 一 1,…, p 时 有 等 号 成 立 ， 因 此 (于; 
。321 ， 


广 ,号 ) 的 极 大 值 点 是 号 = 琴 /n、 证 毕 . 
为 了 讨论 和 加 的 检验 问题 , 先 给 出 乡 和 玉 的 分 布 . 
定理 了 .10 


设 YN MM, D3), Mpp). gl, We 


下方 :并 则 有 

1° yg~N,lp, S/n); 

2° WW~ Wm—1, 2B); 

383” 六 与 玉 独 立 . z 

证 1 显然 ,2* 由 定理 7.3.1° 得， 令 坟 一 也 -， 作 正 交 
阵 U 一 (Ww,)， 考 虑 变换 了 一 UX,， 则 有 W= YPLY = 
KUPAUX-X( 0 0 )X- 及 及 1, 其 中 恒 是 怪 的 前 nw--1 


行 . 而 本寺 一。 这 里 避 是 下 的 最 后 一 行 . 
注意 到 半 一 了 DU, 记 下 一 (zw1…wwn), 有 
Cov (Wa, Wp) =Cov( 3 Urady, p> way ) 
k=1 k=1 


= 这 Ukalpe COV (WY) 


十 ， a= B: 
0, a B. 


由 于 WW 一 各 wan, D 一 池 3° 得 证 . 
现在 讨论 检验 假设 


一 Soc 之 ， S68 = | 


Ho: w= jo. 
先 设 多 >>0 是 已 知 的 ， 则 可 取 检 验 统计 量 
了 会 (8 一 Po) 2 1g — ho). 
显然 有 卫 玉 Xa(5)， 呈 一 2 一 Po) (po). 因此 ,水 平 为 a 的 
担 绝 域 为 
{T>x2,0}。 


现 设 也 >>0 未 知 ， 我 们 用 似 然 比 去 导出 检验 统计 量 。 令 似 然 
比 


< 有 _ max{L(Y; np, 2):n, >} 
ME max{L(Y, po, 2Z):2} ’ 
由 定理 7.8 的 推导 可 见 
《det nm WW- exp{ -号 | 
(dotn( W+n(B ~ po) (B— po) ) 1) oxp{— 号 | 


-| det(W+n(¥— po) (¥ — jp0)’) ] 
detW ° 


W 多 一 Ho 
令 Dp=[, ~ | 
(¥ — io) 一 一 


和 = 


由 附录 A.5.1 得 
det DdotW. (~ 二 (¥~ po WH1 (Fp) ) 


一 -二 det(W+n(¥ — po0) (¥ ~ ko)'). 


从 而 有 A= [n(n WD 0)]E 
记 

Tn(y— po) WY ~ po) (7.17) 
知 入 是 了 的 严 增 函 数 , 故 得 似 然 比 检验 的 拒绝 域 是 {7 之 0}， 出 
定理 7.6.2° 得 : 当 互 。 成 立 , 有 


了 " “oe 人 Fon-s. 


因此 到 临界 值 0 一 二 了 om-pos 就 得 水 平 为 a 的 检验 。 


容易 看 出 T>- 检 验 正 是 一 元 统计 中 检验 的 推广 , 
下 面 讨论 大 个 总 体 情 形 的 均值 相等 性 检验 . 
设 有 个 独立 正 态 总 体 , 分 布 为 NpCp, 卫 ), i 一 1，*…,%, 马 
>0 未 知 ， 欲 检验 假设 
Hop==p (7.18) 
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设 自 总 体 No (pm, 这) 抽取 容量 为 mm 的 样本 


yy'® YS 
. Ld 
Yo=| : | 记 了 -| :| n=SInm. 
2 了 0 


有 似 然 函 数 
L(Y, Fil, "*, Wry 之 ) 


一 Ov. (det 3) oxp| 一 3 > | (YP — pp EY -- 1)}. 


仿 前 算得 似 然 比 


-Ep pe Nt] 
max{L: pi—*" = pr, 本 detW 


其 中 Wi 一 了 YP,Y®, jol, ,hb, W~ YP,Y. 


.， det( WW +. 十 Wa) 
记 4 一 dr 。 
注意 到 


甸 


WS > (YH) (YP -YD)" 


f=1 & 
= EV) yt DD’ 


-> WrB, 


显然 有 六 所 与 妃 独 立 ,WWGn-1, 马 人 ,Wi 


之 )， 5 一 1 …，8， 由 Cochran 定理 到 Wishart 分 布 情 形 的 推广 
(看 定理 7.5), 可 得 B~WW,(% 一 4, 为 , 4)， 因 此 ,在 假设 互 。 成 立 
时 , 40, 有 A~A(p, n--h, b 一 1), 得 水 平 为 a 的 检验 的 拒绝 域 
{4<)c} 中 的 ho 可 由 查 表 得 到 . 

现在 研究 一 2 时 的 特殊 情形 ， 此 时 


2 
B= DDD 
-> mF _ 一 8 _ et ze-") 


334 。 


人 DD Nat (3 一 从 
x (T° 和 一 
网、 PN (FO— B00) (FH— TA 
人 7 yy -一 8 区 2 
= (gH 5") (FH 5?). 
仿 (7.17) 的 推导 , 有 4 是 7 一 (D9 一 9)W2(90 5) 
的 严 降 函 数 , 得 水 平 “的 拒绝 域 | 7?> 2 Fw rd 


最 后 讨论 正 态 总 体 NpCp, 忆 ) 的 协 方差 阵 之 的 检验 问题 . 设 
了 为 容量 为 n 的 样本 .和 欲 检验 假设 
Ho BZ=2Z>0( 忆 Cn). 


, max{L(Y, p, 3); p, 2>0} 
VRE MT moat ph Sop 
仿 前 可 得 


(asi- ez- 中 


(det®o) 2 exp 1 4 trZ2o! Ww 


一 oxp{ hn det WBE) 三 ;exp 二 tr.>0! Wl}. 


一 般 用 入 的 极限 分 布 来 作 检 验 ， 由 定理 3.5 知 310gX->xgotbya 
当 ”%~>oo。 因此, 当 m 较 大 时 可 近似 地 给 出 水 平 为 “的 拒绝 城 为 
{210g N\2>xpcory/9,a}. 
从 上 述 讨论 可 以 看 出 ， 在 多 元 统计 分 析 中 假设 检验 所 遇 到 的 
一 大 困难 是 统计 量 的 精确 分 布 往往 难以 求 出 从 而 , 对 检验 的 优 
良性 就 更 加 难以 讨论 .这 方面 的 某 些 结果 , 如 7- 检验 的 优良 性 ， 
可 参看 Giri <Multivariate Statistioal Inference». 


$7.2 判别 分 析 


(一 ) 判 别 的 概念 
分 类 问题 是 理论 和 实际 工作 者 都 会 经 常 遇 到 的 。 当 我 们 面临 
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一 群 对 象 的 时 候 , 只 要 想 进行 稍微 深入 一 些 的 研究 , 就 往往 需要 将 
对 象 分 类 , 严格 说 来 有 两 种 类 型 的 分 类 问题 。 一 种 是 对 这 群 对 象 
的 属 类 知之 甚 少 , 这 时 分 类 就 带 有 较 大 程度 的 主观 因素 ,例如 可 以 
依据 对 象 的 某 些 指标 , 将 它们 分 类 , 也 可 以 依据 对 象 的 另外 一 些 指 
标 , 将 它们 分 成 另 一 些 类 , 这 种 分 类 有 相当 的 任意 性 . 另 一 种 分 类 
是 已 知 对 象 来 自 个 不 同 的 类 ， 我 们 的 任务 是 将 各 个 对 和 象 分 别 分 
到 这 个 类 中 的 某 一 个 去 ， 这 时 分 类 的 类 别 是 已 经 确定 了 的 .为 
了 区 别 这 两 种 分 类 ， 我 们 把 前 一 种 称 为 限 类 ， 而 把 后 一 种 称 为 判 
别 . 

随 着 多 元 分 析 的 发 展 , 率 类 和 判别 已 逐渐 区 分 开 来 ,并 各 自 形 
成 了 一 些 实用 的 方法 。 但 就 理论 而 言 , 育 类 分 析 比 起 其 它 分 支 来 ， 
还 是 很 不 完整 的 , 限于 本 书 的 宗旨 , 就 不 准备 在 此 介绍 了 . 

判别 问题 的 较 确 切 的 提 法 是 ， 设 有 上 个 总 体 ， 记 为 Gi,…， 
Gr. 已 知 样本 来 自 这 个 总 体 的 某 一 个 ,但 不 知道 它 究竟 来 自 其 中 
哪 一 个 ， 判 别 分 析 就 是 要 根据 对 这 上 个 总 体 的 知识 (由 过 去 经 验 
获得 , 或 从 这 个 总 体 中 抽样 推断 ) 和 待 判别 的 样本 的 一 些 指标 的 
观察 值 , 去 作出 样本 来 自 某 一 总 体 的 具体 判断 . 

需要 进行 判别 的 问题 , 在 现实 生活 中 屡见不鲜 例如 一 个 来 
医院 就 诊 的 病人 ,已 发 现 有 许多 症状 ， 需 要 确诊 他 患 有 何 种 疾病 ， 
如 在 地 质 考察 中 发 现 某 地 有 一 种 矿石 ,需要 判别 是 何 种 矿藏 ,并进 
而 得 出 是 贫 矿 还 是 富矿 等 结论 ; 又 如 植物 分 类 , 社会 调查 、 考古 等 
各 个 性 质 很 不 相同 的 部 门 ,都 存在 判别 问题 ， 因 此 , 判别 分 析 是 一 
种 很 有 实用 意义 的 统计 方法 . 

”在 判别 分 析 中 通常 要 考察 样本 的 多 个 指标 。 例如 , 要 判别 串 
者 的 疾病 究 况 是 不 是 肺炎 ,单纯 用 体温 这 项 指标 显然 是 不 够 的 , 还 
需要 进行 透视 , 化验. 听诊 等 多 项 指标 的 考察 , 才 有 可 能 作出 比较 
可 靠 的 判别 ， 因 此 ,判别 分 析 一 般 属 于 多 元 分 析 所 讨论 的 范围 

进行 判别 的 一 个 先决 条 件 ， 是 要 对 所 涉及 的 个 总 体 有 相当 
的 了 解 ， 用 统计 的 术语 来 说 ， 就 是 要 有 关于 这 些 总 体 的 分 布 的 知 
识 .例如 在 考古 学 中 要 从 头骨 去 确定 它 所 属 的 人 种 ,事先 就 要 对 各 
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种 人 种 的 头骨 进行 必要 的 测量 ， 并 得 到 充分 数据 , 从 而 大 至 十 获知 
总 体 的 统计 特性 , 以 作为 判别 的 依据 . 

下 面 我 们 介绍 几 种 常用 的 判别 方法 .其 中 有 的 方法 较 多 地 依 
赖 统 计 直 观 , 从 理论 角度 看 似 不 够 严谨 ,但 在 总 体 分 布 的 具体 形式 
未 知 的 条 件 下 , 就 判别 而 言 , 难 以 有 较 理 想 的 方法 . 


(二 ) 距 离 判 别 

距离 判别 是 一 种 很 直观 的 判别 方法 , 它 可 从 不 同 角 度 导 出 。 

例如 我 们 可 从 假设 检验 的 角度 去 讨论 ， 设 全 ，Gs 是 两 个 不 
同 的 总 体 ,它们 分 别 有 密 度 函 数 全 和 fo, 要 判别 4 属于 Ga 或 Ga 
就 相当 于 检验 ; 的 密度 函数 了 是 记 或 fp. 记 

Hr: f=f1, Hsf =fs, 

于 是 判别 问题 就 是 去 定 出 一 个 规则 , 根据 观察 值 y, 究竟 拦 受 万: 
还 是 五 ,。 按照 似 然 比 检 验 的 直观 想法 ， 记 入 一 (9) /fa(y)， 当 
和 A<OO>>0) 时 , 拒绝 囊 ;, 否则 就 拒绝 是。， 在 假设 检验 中 , 这 里 
的 O 是 按照 保护 零 假 设 的 想法 选择 的 , 但 在 判别 问题 中 一 般 不 存 
在 比较 重视 某 一 总 体 的 理由 ， 这 时 可 认为 假设 五 !， 且 是 地 位 对 
称 的 ， 从 而 选择 CO 使 得 犯 两 类 错误 的 概率 相同 ， 如 实际 样本 来 自 
总 体 Gy, 但 被 误 判 属于 Gu 记 这 类 误 判 概率 为 ps. 此 时 要 求 pis 一 
Dai. 

判别 规则 可 由 判别 域 给 定 ， 册 上述 方法 导出 的 判别 规则 和 判 
别 域 是 

pe Ro} nfs P20} 0 

当 yED, 状 YEG, i=1, 2. 

下 面 给 出 这 一 方法 在 不 同情 形 的 应 用 。 

1. 正 态 同 协 方差 阵 情 形 设 总 体 G:、 Ga 的 分 布 分 别 是 
ap 宇 ) 和 和 (pa 2), pi¥ ps, >0. 于 是 有 


fi(W) 0 dot DB) oxp[- 吝 (Yh BCY 0) |, sl 2. 
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因此 
log% 一 1og 于 的 - -一 可 FLY 一 pa) 之 一 2 一 Pa) 


\ 一 (8 一 Hi) 之 - a pl. (7.20) 
记 玉 (9) 一 log%, 称 作 判 别 函 数 , 它 给 出 判别 为 
Di={y:.W(y)<1log0}, Ds=— {y: W(Y)> 10g Cj 
(7.21) 
当 yED,, 判 VJEG 6=1, 2. 


经 简单 计算 有 
W(y) = (pa 一 pa) 加 -+(y 一 天 ), 其 中 五 一 字 (pt pa)， 


在 两 总 体 地 位 对 称 时 ， 我 们 取 CO 一 1( 理 由 可 由 下 面 的 讨论 自 
明 )， 这 时 判别 规则 可 由 判别 函数 描述 为 
{0 判 2 属 Ga 总 体 ， 
本 (2 幼 >0, 判 8 属 Go 总 体 . 
(注意 ， 当 两 个 总 体 都 有 连续 型 分 布 , 玉 (y) =0 这 一 事件 出 现 的 概 
率 为 0, 这 种 情形 可 予 忽略 , 原则 上 此 时 可 判 y 辕 任 一 总 体 ,， 故 判 
它 属 Gs 也 无 妨 .) 
从 (7.20) 不 难看 出 ， 判别 函数 (不 计 常 数 因子 ) 是 一 次 型 的 差 ， 
而 这 种 类 型 的 二 次 型 
(Ye 一切 ) Firm—Yy) 《7.23) 
和 欧 氏 空间 BE" 中 距离 概念 的 一 个 重要 推广 相 联系 ， 那 就 是 1936 
年 由 Mahalanobis 所 引进 的 马 氏 距离 


es WAI) Bt). (7.24) 
亦 记 d(xw, 9) 全 1% 一 yj;s, 称 和 为 权 和 矩阵 , 
定义 8 到 总 体 G; 的 距离 为 
u(y, G0) =|y— ls, 4 一 十， 2， (7.25) 
从 而 , 判别 规则 (7.22) 可 改 述 为 
{ 当 dy, 0) <d(y, Ga),MMY EO, 
当 QY, G0) dy, Qa), YEQS. 
所 以 ,我 们 称 (7.22) 或 (7.26) 给 出 的 判别 为 距离 判别 ， 凤 车 离 
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(7.22) 


(7.26) 


总 体态 较 近 .就 判 久 属 Bf 
距离 判别 中 集合 
ty: dy, GN) —Adly, Gs)} (7.27) 
称 为 判别 的 边界 ， 在 两 总 体 有 相同 协 方差 阵 且 遵 从 正 态 分 布 情 
形 , 此 边界 为 过 严 的 超 平面 , 称 天 是 判别 的 阔 值 
下 而 对 0>0 讨论 误 判 概率 ， 记 5 一 号 (jw 一 jo), (由 7.21)， 
当 乡 来自 总 体 Gs 有 


Wy)~N, (Elo), 12l*), 


Poi—pi(W(y) <1logO) 


1 身 
_p BOE RA veo 51° ) 
VDW(Y)) ol 
-$ (log0- 训 16)’) /Il ), (7.28) 
其 中 儿 是 轧 (0, 1 的 分 布 函数 . 
相仿 可 得 , 当 g 来 自 总 体 G 而 误 判 总 体 Gi 的 概率 是 
pa—1—#( (logO+3 6 )/ 6) ). 0.29) 
注意 到 pos, pw 都 是 上 6 的 严 降 函数 ,而 158i? 为 
人民 一 有 有 一 Cp — pa) BD (ps — ps) GG, Gas) 
可 视 为 两 总 体 的 号 氏 距 离 ， 因 此 , 当 两 总 体 距离 较 远 , 则 误 判 概率 
都 较 小 , 否则 就 较 大 , 当 两 总 体 很 接近 时 , 有 po 十 pols<:1。 并 且 有 
| Da1 一 Di9; 


O>1, pai> pis; (7 .30) 
O<0, Pat. 
故 可 由 O 的 选择 来 控制 mi 与 ms 的 差异 . : 
为 了 使 (7.26) 确 定 的 判别 规则 实际 可 行 ， 就 必须 知道 两 总 体 
的 均值 和 协 方 差 阵 , 而 这 往往 是 不 大 可 能 做 到 的 , 故 在 实际 中 不 得 
不 先 对 Ri，Ha 利 之 作 岂 合计, 一 般 地 , 可 取 GG; 中 容量 为 wm 的 样 
。329 . 


本 了 ,j=1, 2 由 87.1.( 三 );， 以 估计 
应 -二 了 ， 一 十， 2, 性- 


代 Mss py 得 
P= Bp) Sy -tthe/2). (7.31) 

以 仿 (y) 代 替 汰 别 规则 (7.22) 中 的 邢 (y), 可 得 (基于 样本 观察 值 
的 ) 距 离 判 别 ， 对 于 它 的 误 判 概率 的 研究 就 变 得 相当 复杂 , 不 在 此 
进行 . 

2. 分 布 自 由 情形 ”现在 不 限制 总 体 的 分 布 形 式 ， 只 假定 @ 
有 相同 协 方差 阵 这 ,有 均值 Ai， 5 一 1， 2, ji* ja, 

注意 到 (7.22) 给 出 的 判别 规则 ,本 身 只 和 分 布 的 二 阶 矩 有 关 ， 
依然 可 看 作 是 由 样本 到 总 体 的 马 氏 距离 的 大 小 来 作出 兹 别 ， 我 们 
可 将 此 距离 判别 移 用 到 分 布 自由 情形 中 来 . 此 时 , 因 不 知道 分 布 
形式 , 当然 无 法 计算 误 判 概率 的 大 小 , 故 记得 规则 可 看 成 一 种 实用 
的 方法 , 方法 的 优良 性 也 唯 有 用 实践 去 检验 . 

容易 想到 一 个 问题 , 既然 是 用 距离 判别 , 为 什么 一 定 要 用 马 氏 
距离 呢 ? 其 它 距 离 可 不 可 用 ? 欧 氏 距离 岂 不 更 简单 ? 要 确切 地 回 
答 这 些 问 题 是 困难 的 . 事实 上 ,采用 其 它 距 离 的 方法 已 在 实际 工作 
中 出 现 ， 下 面 仅 就 马 氏 距离 和 欧 氏 距离 的 比较 , 谈 一 些 看 法 ， 首 
先 ,在 实际 问题 中 必然 这 及 尺度 的 选择 ,各 个 指标 一 般 有 不 同 的 属 
性 和 量 纲 .如 果 采 用 欧 氏 距离 ,不 难看 出 , 它 和 量 纲 的 选取 有 很 大 
关系 , 那么 , 结果 将 随 量 纲 的 不 同 而 可 能 很 不 相同 , 这 明显 是 不 合 
理 的 .但 马 氏 距离 是 无 量 纲 的 , 它 受 尺 度 选 取 的 影响 就 自然 较 少 ， 
这 是 用 马 氏 距离 的 理由 之 一 。， 另外, 欧 氏 距离 未 把 各 指标 的 方差 
和 相关 考虑 进去 ， 而 马 氏 距 离 中 的 了 是 协 方差 阵 ， 从 而 把 方差 和 


3 0 
相关 考虑 在 内 , 结果 可 以 使 两 者 相去 甚 远 ， 例 如 3-( 2 
ci> aa 欧 氏 距离 为 
[wy = [yt (va yo) 


有 
YP YD 
Ni 十 Na 一 2 名 4 


而 马 氏 距离 是 
。 330 。 


I — ys= [v1 — yi)?0T?-t (ra — yo) 

因 o>oo， 第 一 个 指标 的 方差 大 , 其 差异 的 意义 就 相对 较 小 ， 故 
用 ci 除 后 再 作为 距离 中 的 求 和 项 ， 明 显 较为 合理 又 若 之 一 
的 性 (VY 万) 令 w=(1, 1)', y=(1, 
一 4)', 如 考虑 它们 到 0 的 欧 氏 距离 ， 有 [zl = | 赴 = 2 但 马 氏 
距离 1x|s=~M2CV3 一 <M2CV3+1) 一 |y|z， 由 于 两 个 指 
标 存 在 正 相关 , 放 当 两 指标 异 号 时 与 原点 距离 较 远 是 合乎 情理 的 . 
这 就 是 支持 马 氏 上 距离 作为 判别 依据 的 又 一 理由 . 

3. 协 方差 算 阵 不 等 的 情形 ” 先 设 G41，Gs 是 两 个 总 体 ， 分 别 
有 均值 Ki，Fps 和 非 奇 异 协 方差 阵 也 天 3。， 仿 (7 .20) 令 判别 函数 


W(y) -3[(y 一 Pa) 之 5 (8 一 po) 一 (8 一 Po) Br (Y ~ ps)] 
(7.32) 
仍然 用 判别 规则 (7. 22). 但 此 时 丈 (2) 不 再 是 线性 函数 ,判别 边 
界 将 是 2 维 空间 中 的 二 次 曲面 , 误 判 概率 的 计算 更 为 复杂 . 现 仅 以 
多 一 二 总 体 分 布 为 正 态 为 例 进 行 讨论 ,不妨 设 ji>>ja，Y E(k 


10), 由 d(y, 的 ) 一 4(y, Gs) 可 推出 一 人， 解 得 


WGat WoO 一 
re (¥p) 


yo 正 是 判别 的 阔 值 ， 判 别 可 记 为 

y<yo, NOYEGs Yy>Yyo, MYEQ. 
车 cs>cl, 阔 值 较 人 靠近 jw; 车 oo 二 01, 阐 值 较 靠 近 js。 不 难 算出 
误 判 概率 


Za 一 | Crog oxp{ - Wt)ay dy = | cm Soxp | 一 号 | dz 


Wo 一 


-区 (上 和 )， 
> Mi0a 二 + Wa Ka Wi 
0 一 -aca 十 Lact 8- 
这 里 Ci 十 0as 7? 0 十 0g 
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其 中 示 是 入 (0, 1) 的 分 布 函数 ,相仿 可 得 
P11— 由 (全 二 ) 一 pa， 


现在 考虑 天 个 总 体 的 一 般 情形 ， 设 总 体 有 均值 ws， 协 方 
差 阵 之 记 GZ(2/， GH) 一 [|y ~ pls,, 且 令 
六 一 二 :4 G0 ~mind(y, GD)}, i—1, **, hb. (7.88) 


为 判别 区 域 ， 汰 别 规则 是 

当 gEDs, 状 yy 来 自信 ,b=1,…, 上 . (7.84) 
此 规则 在 D; 与 Dj 的 交界 处 有 不 确定 性 ,但 车 总 体 存在 密度 沙 数 ， 
在 交界 处 可 判 属 这 两 个 总 体 的 任 一 个 . 因 交 和 集 的 概率 为 零 , 这 种 
不 确定 性 不 妨 予 以 忽略 ，D; 的 计算 涉及 pb 维 空间 中 的 二 次 曲面 ， 
原则 上 并 不 十 分 困难 . 但 我 们 不 必 求 出 它 的 界限 , 而 可 由 D; 的 定 
义 ,根据 个 值 {4(y, G9), j 一 1，…, 由 的 极 小 值 就 作出 判别 。 误 
判 概率 的 计算 不 在 此 讨论 . _ 

(三 )Fisher 判别 函数 

1. 最 优 线 性 判别 函数 ”Fisher 提 出 了 一 个 很 有 意思 的 想法 ， 
假定 仅仅 考虑 线性 判别 函数 a‘'y， 即 以 各 个 指标 的 加 权 和 作为 一 
个 综合 指标 来 作为 判别 的 依据 ， 那么 , 怎样 的 线 件 判 别 沙 数 是 最 
好 的 呢 ? Fisher 给 出 了 如 下 准则 : 一 个 判别 函数 是 好 的 , 它 在 各 个 
总 体 中 去 求 均值 所 得 个 数 应 有 较 大 离 差 ， 但 这 个 离 差 的 意义 应 
相对 于 判别 函数 总 方差 去 衡量 , 为 此 可 令 


四 ， 1 x ， 9 
Na sna) Bay EX Bay | 
之 Da 1) 
其 中 媚 ， 六 表示 在 第 个 总 体 中 求 均值 和 方差 。 4(a) 被 称 为 
Fisher 准则 . 我们 有 
定义 了 .2 
如 果 Wy 满足 


(7.35) 


440) 一 maxz4(a) (7.36) 
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则 称 wxg 是 最 优 线 性 判别 函数 . 
由 矩阵 代数 知识 , 不 难 求 出 (79.36) 的 解 ， 将 (7.35) 彭 成 矩阵 
形式 有 ， 
Zp pp) KK)'a ~ aMa 
«(> 35.)a 六 
(很 明显 4(@) 只 依赖 于 a 的 方向 ， 而 与 @ 的 长 度 |al 无 关 ,) 其 
中 pu 是 第 名 个 总 体 的 均值 ， 己 ,是 第 和 个 总 体 的 协 方差 阵 ， 捕 一 
1 9 
天 匀 
M=- Sm _A) mn)’, 2» 习 ,, 设 卫 >0. 9. ba 
不 妨 设 12 = 二 于 是 有 
4(ag) -AB D-DD MS ib. 
由 附录 A.4.2 知 ， 
maxb’ 2 ME b= B-M) 会 AL 


好 1= 


Aa)= 


极 大 值 点 为 之 28 瑟 习 的 相应 于 和 的 特征 向 量 ci， 因此 一 


号 飞 c 是 写 -+ 人 的 相应 于 和 的 特征 向 量 ， 得 最 优 线 住 判 别 函数 
Wg) 一 Qi1Y, 称 和 1 是 Wi(g) 的 判别 效率 . 
依据 V1(9) 的 判别 规则 是 ; 计算 玉 1(9) 与 WC) 的 距离 
dWA), Wp)) = LYE, jl, , h, 
(@' Da) 
(7.37) 
然后 将 8 判 属 使 (7.37) 达 最 小 值 的 那个 总 体 . 

由 于 pv 不 全 相同 , 卫 5 至 至 少 有 一 个 正 特征 值 ， 一 般 
地 说 ,之 -MM 的 正 特征 值 不 至 一 个 , 设 为 入 宇 … 宇 入 0, 而 用 一 个 
综合 指标 dg 对 进行 判别 也 可 能 不 足以 得 出 确切 结论 , 这 时 可 
引进 相继 的 最 优 线性 判别 函数 ， W;(9) 二 Qly, 5 一 2, …, 7。 其 中 
Gw, 是 马 -:M 的 相应 于 特征 值 x 的 特征 向量 ,5 一 2, …, 7， 可 用 
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个 综合 指标 来 判别 y. 记 4 = (ai…ar), 有 4 到 G; 的 马 氏 距离 
为 
dAY, Ap)=y— 1) CD TAY — pi) 
(7 .38) 

从 而 伪 (7 .34) 可 得 距离 判别 的 判别 规则 . 

这 种 用 了 个 指标 4'g 代替 个 指标 y 进行 推断 的 思想 , 与 下 
节 将 要 叙述 的 主 成 分 分 析 的 基本 精神 是 一 致 的 . 

2，Fisher 准则 与 其 它 判 别 的 关系 ”Fisher 准则 与 距离 判别 
的 关系 ,在 有 一 2 时 易于 看 出 。 此 时 


Aa) 一 GE (Ha 一 Ma) 一 Ja) a/20' Ya, 访 一 二 (Dit). 


因此 号 2M 一 二!1(pa 一 ps)(jpa 一 js) ， 它 有 唯一 特征 值 为 去 
x (je 一 po) 写 4Cpy 一 ps) 一半 上 1-1 及， 相应 的 特征 向 量 (不 
计 常 数 因子 ) 为 

一 了 +(lxa 一 wa), 得 最 优 线性 判别 函数 

WY)= (pa Ha) BY- (7.39) 

故 (7.37) 给 出 的 判别 与 (7.26) 一 致 (在 刀 一 忆 时 ) 

不 难 将 Fisher 准则 推广 , 即 在 (7.35) 中 将 a' 换 为 y 的 任意 
(可 测 ) 函 数 a(y)， 情 形 将 会 怎样 呢 ? 设 一 2，G, 有 密度 函数 


fi(y), 于 是 也 a 一 |al(y)f(y)y, 得 


{ay) [fi(¥) -js()]oy| 


[tat) -Ba (est [IoCy) Boal (dy 
(7 .40) 

设 4(a) 的 极 大 值 点 为 ao(y), 令 olV) 一 golY)+A6(Y), 其 中 入 E 

BR',，5(y) 是 任意 (可 测 ) 函 数 , 从 而 可 记 

a) 一 40co NM, 0). 


视 4(a) 为 和 的 函数 ,应 在 一 0 达 极 大 值 , 故 有 -224@7| ”=0. 记 


= 


a 


d(a) = 
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Po- | Qo(W fi dy, Do=| [ee 外 — Bi fy)ay, 7 一 二 2, 
经 初等 计算 得 aoly) 应 满足 
[{CDiot+ Do) (fi—f3) ~ (Bio— Boo) Lao— Bo) 户 


+ (go0— Bao0)fal}b (Yay =0, 
由 5(g) 之 任意 性 可 得 
(Do Da0) (Cf1—f3) -Bs— Boo) [Go— Bio) fi 
十 (ao 一 ao)jfa] 一 0， 


解 出 . 
zo (d+ Bio) 六 一 (d—E a0)fa 其 中 本 Dio+ Dao 
(W) ~ fi t 上 3 2 Fo Be 


由 4(6) 的 表达 式 (9. 40) 易 见 ， 当 wo(2) 是 极 大 值 点 ， 它 的 线性 函 
数 uo(gj) 十 B 亦 是 (7.40) 前 极 大 值 点 . 

设 wi, rra 分别 是 总 体 人 FH 和 Ga 的 先 验 概率 ， 即 在 混合 总 体 
、 中 ， Gi 所 占 的 比重 为 mmit ma—1), so 呈 1, 2。 用 待定 系数 法 ， 容 
` 易 算出 ， 当 取 


w 一 1 十 和 rs 8= ma(0— Hao )- -wd Bo) 
2d+ Byo0— Hyo ’ 24 十 五 io 一 五 ao 


就 有 

sao(y) + oh) eat (7.49) 
是 (7.40) 的 极 大 值 点 ， 即 它 是 最 优 判别 函数 。 以 a( 妇 为 判别 函 
数 , 得 判别 域 


1—{y: 0(Yy)>0}=— | y: f1(Y) > 于 fag， 
Da~— {y: oy) <0} -{ y: f(y) < ja 外 
这 就 与 (一 ) 中 由 假设 检验 方法 所 得 的 判别 (7.19) 相 同 ( 取 C 一 -了 


时 ). 
从 下 自 的 讨论 还 可 看 出 , 当 我 们 用 Bayes 方法 去 研究 判别 时 ， 
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| 


在 总 体 个 数 有 一 3 时 ,所 得 结果 亦 与 (7.49) 一 致 


(四 ) Bayes 判别 

Bayes 判别 是 判别 分 析 中 最 常用 的 方法 之 一 。 

Bayes 统计 的 基本 思想 已 在 第 五 章 中 前 述 . 将 它 用 于 判别 无 
任何 原则 困难 . 在 判别 问题 中 , 参数 0 实际 上 只 取 个 值 ,分 别 对 
应 着 个 总 体 的 密度 有, 5 一 1,，…,%， 不妨 认为 参数 9 就 取 值 

8 设 wy 人 P04 一 ), j 一 1，…,b, 是 先 验 概率 , 如 果 样本 来 
自 0 但 误 判 属 6 的 损失 记 为 ZL(i, 力 ， 而 这 种 情况 发 生 的 概率 
《 即 误 判 概率 ) 为 


py 一 | f(y)9y | f(y)xm()dy，D, 是 判别 域 
于 是 平均 损失 ( 即 风险 函数 ) 是 
SG, | nD ay. 


这 时 判决 函数 实质 上 就 相当 于 一 组 判别 域 
DD 一 {D1,…, Dw}, 满足 UYD,=R?, P,( DN DD)) 0, 
(7.44) 
其 中 jj 一 1，…,%b, 当 yE D4, 就 判 y 来 自 人 Gs. 
由 先 验 分 布 w 得 Bayes 风险 为 


BAD) -Hr LG, frn(D fay 
-xD ELG, HAW (7.45) 


记 h(g) 一 名 mL(i, j)J()， 现 在 的 目标 就 是 求 一 组 判别 域 D 
使 得 BRA(DD) 达 极 小 值 , 称 DD 为 Bayes 解 ,或 Bayes 判别 . 
令 D,= {y: hy) = min hAY)}, d=1, .…, k. (7.46) 


我 们 来 证 明 这 样 给 出 的 D 就 是 Bayes 解 , 事实 上 , 设 D" 是 任 一 组 
判别 域 ,我 们 有 
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RD") — Ri(D) 
一 p> | xpx CY hi Ay 一 > [xo (gy)ay 


t=1 
Ly 


到 六 | Kos (WY ) Xo (Yh (YAY 


1=1 
x 


DE xo) ro (hy) dy 


-之 > | Xpsnp(Y) [hg ) — hs (y)Jay, 


由 于 D; 的 定义 知 Xpynp, CY ) [gy) 一 hi(y)1 之 0， 故 得 Re(D”) 
Rn(D)>0, 因此 忆 是 Bayes 解 . 


现 设 Li, 2)—{ 
则 有 Bayes 判别 的 判别 域 为 
D,= {yy: 2 wf Y) 一 min 放下 d=1, **, hk. 
(7.47) 


1, iAy, 
0, $¢=/. 


在 h~2 的 特殊 情形 下 , 由 (7.47) 得 
D,= fy: fy) > fel)), 


D,= fy i(W) < faly) 
与 (7.48) 一 致 ， 记 0 一 m/s, 又 与 判别 (7.19) 相 同 。 几 种 判别 广 
法 在 一 定 条 件 下 的 一 致 ， 实 际 上 就 从 不 同 角度 说 明了 这 些 判别 广 
法 的 合理 性 , 


$7.3 多 元 线性 模型 


在 一 元 统计 分 析 中 ， 我 们 在 线性 模型 的 范围 内 讨论 了 应 用 最 
广 的 回归 分 析 和 方差 分 析 方法 ， 一 元 线性 模型 刻 划 了 一 个 因 变 量 
对 一 个 或 一 组 自 变量 的 统计 依赖 关系 ， 当 这 种 统计 依赖 关系 对 于 
自 变量 的 效应 而 言 是 线性 的 , 或 近似 于 线性 的 , 用 线性 模型 来 处 理 
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是 方便 而 有 效 的 。 在 本 节 中 , 我 们 把 线性 模型 自然 地 推广 到 多 个 
因 变 量 情形 , 并 得 到 回归 分 析 和 方差 分 析 的 推广 , 


(一 ) 多 元 线性 模型 

一 般 地 说 ,在 实际 应 用 中 , 我 们 仅仅 对 试验 结果 中 的 单个 指标 
感 兴趣 的 情形 是 较 少见 的 , 更 多 的 是 关心 p 个 相互 联系 着 的 指标 ， 
也 就 是 p 个 随机 变量 了 ;,…, 了 5, 称 为 因 变 量 . 这 些 试验 结果 的 
观察 值 有 可 能 线性 地 依赖 作为 试验 条 件 的 自 变量 卫 1,…， 了 a 的 
效应 ,但 存在 着 试验 误差 .于 是 了,，…, 了 Ys 就 可 表 为 这 些 效应 的 
线性 模型 。 在 不 可 控制 的 观测 中 ,可 化 为 线性 模型 的 情形 也 很 党 
见 。 例 如 在 某 个 地 域 的 个 点 上 , 测定 了 地 质 样 品 中 种 化 学 元 
素 式 化 合 物 的 含量 , 得 到 个 p 维 向 量 y，…,. 这 些 ys 应 当 是 
地 理 位 置 (w， 中 的 连续 函数 , 可 以 用 多 项 式 去 近似 , 如 采用 二 次 多 
项 式 , 则 yo 看 作 多 项 式 系数 的 函数 是 线性 的 考虑 到 观测 与 模型 


误差 ,我们 有 多 元 线性 模型 
| ; 2 只 1 Ww Bor po … Bop 
1 WU oo 了 中 Bea … 7 
81 | 
| : | (7.48) 
5n 


这 就 是 地 质 中 趋势 面 分 析 的 模型 。 当然 ， 久 了 对 这 些 模型 进行 分 
桥 ,还 得 附加 一 些 必要 和 合理 的 假定 . 

现在 我 们 给 出 一 般 的 多 元 线性 模型 ,从 形式 上 讲 , 它 只 不 过 是 
将 一 元 情形 的 一 个 因 变 量 了 推广 到 多 个 因 变 量 了 1, …, 了 ，,. 试验 
点 的 概念 和 记 法 与 一 元 情形 完全 相同 ,个 试验 点 记 为 


全 
[uh 


[eo 


也 称 得 为 设计 甜 阵 ,但 这 里 w 个 观察 值 yi,…, 8 都 是 p 维 向 量 ， 
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(ERTS 


应 记 成 nxp 阶 矩 浴 


Vit ** Yip B11 *'* Bip 
Y=| :  : ]， 相 应 的 误差 阵 s 一 | : :| 


Yni … 2 Eni 。… Bog 
未 知 参数 矩阵 记 为 
Bi 。 Bi 
| : : | 是 一 个 gxp 阶 阵 , 
Ba '*'* Ba : 


它 的 第 了 列 B; 影响 着 试验 结果 的 第 7 个 指标 。 车 记 了 的 第 了 列 
为 ,我 们 有 模型 
Y=XBte;, j=—1, ., , (7.49) 
由 (7.49), 多元 线性 模型 似乎 单纯 是 2 个 一 元 线性 模型 的 混合 .这 
就 涉及 到 我 们 一 开始 就 提 到 过 的 p 个 指标 之 间 理 应 存在 相关 ， 设 
观察 值 怎 阵 的 各 行 互 不 相关 且 有 相同 的 协 方差 矩阵 32, 也 就 是 说 
Oov (ga, Ye) =— dag, 


0 
这 里 64 是 Kroneoker 指标 ， 即 Se 一 | oe 因为 因 变 量 间 


这 种 联系 的 存在 ,不 宜 使 用 (7.49) 的 记 法 , 而 五 体 地 记 为 
Y= XB.Ee. (7.50) 
并 附加 假定 
Be 一 0, 8 各 行 不 相关 有 共同 协 方差 隆之 >0. (7.51) 
在 本 书 中 总 假定 多 元 线性 模型 (7 .49) 满 足 假定 (7 .50)， 以 后 
再 提 到 时 常常 不 予 补充 说 明 . 很 显然 ， 这 正 是 一 元 的 一 般 线 性 
模型 V~ (了 8B, o? 门 到 多 元 情形 的 自然 推广 ， 称 为 一 般 多 元 线性 
模型 , 这 里 的 多 元 是 指 因 变量 是 多 个 的 , 有 时 为 明确 起 见 也 称 为 多 
指标 的 ， 在 第 六 章 的 回归 分 析 中 ,我 们 也 提 到 过 多 元 线性 回归 , 那 
时 是 针对 多 个 自 变量 而 言 ， 今 后 在 谈 到 多 元 线性 回归 时 可 能 指 的 
是 多 指标 情形 , 相信 在 出 现 具体 模型 时 , 不 致 引起 混淆 , 我 们 避免 
结 习 饥 上 已 经 形 克 的 名 词 以 另外 的 称谓 . 
在 一 元 线性 模型 中 参数 是 向 量 B6 和 数 oo“>0, 而 在 多 元 情形 ， 
。839 ， 


参数 是 矩阵 如 和 协 方差 阵 写 >0， 这 时 ,参数 的 统计 推断 ,基本 .上 
都 是 一 元 情形 的 平行 推广 ， 在 估计 问题 中 , 这 种 平行 推广 不 存在 
任何 实质 性 困难 ,但 在 涉及 假设 检验 和 区 间 估 计时 , 由 于 多 元 统计 
量 分 布 的 复杂 性 ， 有 些 困难 就 很 不 容易 解决 ， 但 就 方法 的 形式 而 
育 , 仍然 可 以 说 是 一 致 的 . 
多 元 谎 性 统计 推 岂 与 一 元 情形 的 极其 相似 可 用 这 两 种 模型 实 
质 上 的 一 致 来 说 明 . 事实 上 我 们 可 以 设想 将 观察 值 害 阵 了 按 它 
的 行 序 将 其 元 素 逐 个 地 记 成 一 列 , 设 为 
于 一 (241 YipYa1 ap gaop) 
且 将 吾 , 6 也 按 上 法 处 理 记 成 
B= (Bu ‘BipBar* “ “Bap: “Boar “ ‘Bp) 'y 
: 8 一 (811…81p891…89pg 8n1 Eng)’ 


于 是 模型 (7.50) 可 改写 成 


了 0 Vig 0 
0 世人 0 vig 
Y= : : B -Fé, (7 .52) 
wi 0 Wag 0 
| 0 wi 0 wno 
条 件 (7.51) 亦 随 之 变 为 
马 0 
3 . 
BHée=0, Qove= 2 , (7.53) 
0 之 


虽然 满足 (7.53) 的 一 元 线性 模型 (7.53) 与 我 们 在 86.5 中 所 讨论 
的 一 般 线性 模型 有 所 不 同 , 但 不 过 是 稍 加 推广 而 已 ,毕竟 还 是 线性 
模型 ， 它 是 更 广泛 的 一 元 线性 模型 的 特例 ， 所 以 说 多 元 线性 模型 
的 参数 统计 推断 问题 ， 本 质 上 与 一 元 的 相同 ， 可 在 一 元 模型 中 进 
行 ， 由 于 我 们 在 第 六 章 中 并 未 讨论 如 (7 .52) 和 (7 了 .58) 的 模型 ， 并 
且 为 了 保持 多 元 统计 推断 问题 的 原来 面目 ， 我 们 的 讨论 将 对 模型 
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47 .50) 进 行 ,对 于 (7 .52) 就 不 子 深 入 展开 了 。 


(二 ) 参 数 估 计 及 其 分 布 

现在 对 清 足 假定 (7.51) 的 多 元 线性 模型 (7.50) 考 碟 参 数 估计 
问题 . 

与 一 元 情形 相仿 , 如 果 不 对 设计 矩阵 的 秩 加 以 限制 ,就 存在 可 
佑 性 问题 ， 但 可 估 性 问题 取决 于 设计 阵 及, 故 在 多 元 情形 与 一 元 
情形 完全 类 间 ， 就 不 再 予以 闭 述 . 凡 要 用 到 的 事实 ， 就 直接 引用 
$6.5( 一 ) 中 结果 .为 了 讨论 方便 , 在 大 多 数 情形 下 , 我 们 只 考虑 
脏 满 列 秩 情形 ， 即 设 zk 卫 g, 并 将 可 能 出 现 的 互 的 第 一 列 全 为 
1 的 情形 , 除非 特别 说 明 , 一 般 也 包括 在 内 . 

对 于 参数 矩阵 BB 的 估计 ， 可 用 一 元 情形 下 最 小 二 乘法 的 推 
广 ， 在 一 元 情形 , 设 户 是 8 的 估计 ， 则 讨论 剩余 ( 残 差 ) 8 一 Jy 一 
下 BB 的 平方 和 , 即 8%, 使 之 极 小 化 , 所 得 估计 量 就 是 最 小 二 屁 估 
计 , 现在 的 问题 是 : 设 只 是 BB 的 估计 , 则 剩余 ( 残 差 ) 8 一 了 一 子 B 
是 一 个 % xz 阶 矩 阵 ， 如 果 也 要 讨论 它 的 “平方 和 极 小 ”, 究竟 在 什 
么 意义 下 进行 呢 ? 相仿 可 取 剩 余 “ 乘 积 和 ” 甜 阵 为 8, 称 它 为 残 积 
阵 ， 而 它 的 “ 极 小 值 * 可 在 非 负 定 意义 下 去 理解 ， 即 车 吾 是 我 们 和 欲 
求 的 优良 估计 ,我们 希望 它 能 满足 。 “. 

(了 一 XB)(Y- XB)- (Y- XBY (7- XX 六)>0( 非 负 定 降 ) 

或 记 为 

(FY—- XB)(Y-XB)>(Y- XB)(Y- XB), 对 — 切 B. 

(7.54) 

由 于 当 C>>D>0 时 , 必 有 它们 的 从 大 到 小 排列 的 顺序 特征 值 ， 
入 (OQ), 入 (DD) 满足 和 为 (C0) 宇和 (CD), i=1,…, 7, 这 里 "=rkD. 央 


此 有 I %(C)>II (DD), 且 有 fC>tr DD, 等 特性 质 ， 故 (7.54) 


是 ~ 个 很 强 的 结果 ， 当 p 一 1, 它 就 使 残 差 平方 和 极 小 。 作为 一 元 
情形 的 推广 ， 我 们 仍 称 满足 (7.54) 的 信 计 为 如 的 最 小 二 乘 信 
计 . 
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定理 .11 
对 于 模型 (7 .50)( 这 里 是 否 满 足 假定 (7.54) 是 无 关 紧 要 的 )， 
满足 正规 方程 


于 B= YY (7.55) 
的 号 是 召 的 最 小 二 乘 估计 , 且 对 号 而 言 , 残 积 阵 是 
R= Y’'PnY (7.56) 


证 用 平方 和 分 解法 得 
(Y—- XB)(Y- XB)-(Y- XB)(Y-XB) 
+ (EB- XB)(XB--XB)+(Y- TB)(FB-XB) 
+ (XB_ FB)(Y- XB). 
由 于 如 满足 正规 方程 (7.55), 知 上 式 右 边 后 两 项 为 零 ,得 
(FY- XB)(Y- XB)-(Y- XB)'(Y- XB) 
—(XB- XB)(XB- XB)>0. 
如 果 上 式 不 等 号 改 为 等 号 , 充 要 条 件 是 
X(B-B)=0, 

但 由 此 可 推出 肝脏 (如 BB) 一 0, 由 天 时 可 逆 得 如 = 避 。 故 若 另 
一 估计 的 残 积 阵 与 人 B 的 残 积 阵 相同 , 此 估计 必 为 如. 

由 于 如 = (于 卫 ) 证 ' 了 , 即 得 

(YY— XB)(Y— XB)= YY(I— X(XR)-1 XA) Y= YPY. 

记 此 残 积 阵 为 Ro, 定理 证 毕 . 

注 记 , 为 了 使 肪 是 五 的 最 小 二 乘 估计 , 刁 满 足 人 7 .55) 不 仅 是 
充分 的 ,而且 是 必要 的 ,必要 性 的 证 明 留 作 练 习 . 

与 一 元 情形 的 定理 6.5 相仿 可 得 

定理 7.12 

在 模型 47.50) 下 , 参数 的 线性 函数 好 召 的 一 切线 性 无 仿 估 
计 节 克 ' 丈 中 ,让 CC 有 是 唯一 的 极 小 方差 估计 , 即 三 C 下 是 访 C 有 

的 BLU 了 BE， 其 中 至 = (瑟瑟 )- 于 在下 是 好 的 最 小 二 乘 估计 ， 

证 因 Bt DYT=tr CB 对 一 切 BB 成立， 知 tr DXB-= 
谋 CB 或 t(D 及 -C0C)B=0 对 一 切 如 成立, 故 有 DD 及 =C 为 
无 偏 性 的 充 要 条 件 ， 易 见 全 是 BB 的 无 偏 估计 ， 注 意 到 
» B42 。 


XB-PY (7.57) 
我 们 有 i CC 局 一 二 DD' 下 入 tr D'PyY 了 .对 于 任意 的 谍 ' 了 我 们 有 
D(A'PD -DirYA) -DSya) = Dasa, 
-tr2A’A. (4A’= (ga 
因此 D(trC'B) =D(tr D'Pr PD =tr BD'PD<tr ED'D 
一 了 (tr DT. 
且 上 式 相 等 的 充 要 条 件 是 YD'(I- 已 0) 万 了 3 一 0, 即 (TPx) 
“D330, 或 DPzD， 于 是 有 
D'FY=D'PzrY-D'XB-C'B. 证 毕 . 
FF 面 在 正 态 性 假定 下 进行 讨论 ， 由 $7.1( 二 ) 的 记号 , 设 
s~N.,(0, I, 3). (7.58) 
称 满足 (7.58) 的 模型 (7.50) 为 正 态 模型 
定理 YY.13 
设 正 态 模 型 (7.50), 如 是 的 最 小 二 乘 估 计 , Ro Y 了 Psy,Y 
是 残 积 阵 , 记 仿 二 Ro, 则 有 ( 愉 , 全 ) 是 (B， 习 ) 的 极 大 似 然 信 计 . 
证 这 时 似 然 函数 为 
L(Y, B, 2) 
0O.(detD) exp| -于 Hye Bw)' Dy — BE'wo)| 
其 中 ‘是 全 的 第 2 行 ， 注 意 到 
Sve Bes)'B(y— B'e,) 


=tr 写 -1 3 (ya— Bri) yas- Bw) 
-tr5-1[(F ~ XB)(Y — XB)+(XB- TTP) (XB XB) 
>tr 3-1Y'Pr.Y ~tr 2-1R,o 
江上 式 等 号 成 立 的 充 要 条 件 是 B 一 县 。 以 下 证 明 与 定理 7.9 的 证 
明 完 全 相同 ， 得 证 . 
” 注 记 , 与 定理 7.8 相仿 , 我 们 可 证 ( 妨 ， Bo/n 一 g) 还 是 (B, 习 
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的 极 小 方差 无 偏 估计 ， 但 方法 完全 类 似 就 不 予 袭 述 了 .至 子 Ro/ 
(n 一 9) 是 2 的 无 偏 估计 ,可 在 不 假定 正 态 性 的 一 般 条 件 下 验证 , 事 
实 上 因 Px. 是 秩 为 % 一 g 的 正 投 影 阵 , 必 存 在 正 交 阵 UU 使 U'Pzx.U 


I, 0 
-( 人 路 了 


0 
| I, 0 
R,= r'UU'PeUU'Y- YU 0 0 TT 
注意 到 ZaU'Y~Nw0, 五 号 )， 记 2Z' 一 (Zi…2Zn) 有 Ro~ 
1 ZZ 因此 得 z 
HRo— 5 EZ (n—g)D (7.59) 
关于 呈 和 Ro 的 分 布 ,我 们 有 
定理 7.14 


设 正 态 模型 (7.50), 如 ,， R。 分别 是 的 最 小 二 乘 估 计 和 残 
积 阵 , 则 有 

1° B~N,(B, (FE)-!, DB) 

2° Ro~W,n—g, 2D); 

3 肯 与 Ro 独立 . 

证 俘 - (防卫 )-! 了 了 由 定理 7.1 立 得 1?。 注意 到 
B'X'Py, 久 B=0, 由 定理 7.2.7.8,1° 得 2°. 再 由 (于 /至 )-1 了 Px 
一 0, 根 据 定 理 7.3.2" 得 3". 

现在 我 们 把 回归 和 预测 的 概念 推广 到 多 元 情形 中 来 ， 设 因 变 
量 了 :，…， 了 ,对 自 变 量 下 :，… 忆 4 的 统计 依赖 表现 为 ， 当 于 

., 玉 o 给 定时 ， 有 如 下 的 线性 模型 ， 


(Fi:Y)) = (lo1: ‘20)B 十 《81…8p) 《7.60) 
[ Bo … Co 
其 中 Be 二 fs 
Ba : Bo 


称 Bs 是 第 i 个 自 变 量 ,对 第 3 个 因 变 量 了 ;的 效应 ，(7.60) 就 
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4 和 是 ，，， 


” 和 


是 总 体 回 归 模 型 。 
由 $7.1( 一 ) 性 质 5( 看 Ct. 8) 式 ) 可 以 看 出 ， 当 (了 :，…， 了 
和 1 Xo) eZ~ Noraly, 站), 记 
EY yy Dyx 
(oY) v- (5 3 ) V>0, 
则 当 于,，…， 辽 ,给 定时 ,了 一 (了 3, …, 了 s)' 的 条 件 分 布 
YIX~NAEY+rDyr Dr EER), Drr-- DyrDrkD rr). 
可 见 总 体 回归 函数 是 


盏 荆 十 定 rz 之 让 ( 且 一 五 及 )， (7.61) 
不 难看 出 , 以 回归 方程 。 
PBY+ SyrDik(F- BX) (7 .62) 
作 工 的 预测 , 预测 误差 的 协 方差 阵 是 
之 ry 一 忆 rz 刀 让 侣 xz7。 47 .63) 


这 些 都 是 一 元 情形 的 自然 推广 , 
相仿 , 由 最 小 二 乘 估计 得 回归 系数 的 估计 
B=-((1: XY: X))-1: HY 
nn LX .vy,, 
-x | OY 
Tri KPA)-: 2 1 (KX'PLX)- 
外 .五 ) 于 全 (XPLX)! 
LY LY/n_ LR/n(XPLR)1 FP.Y) ) 
x( wy)- ( (X'PL¥)-1 EPLY) : 
(7.64) 
这 与 总 体 回 归 情 形 以 桩 本 和 矩 奉 代 总 体 矩 所 得 结果 完全 一 致 ， 并 且 
与 一 元 情形 也 十 分 相仿 . 


(三 ) 线 性 假设 检验 
先 讨论 回归 模型 (7 .60) 的 假设 检验 。 这 时 要 检验 的 假设 是 
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1 B11 “°" Bar 
Ho: 2B | : : 一 0. 
Ba ~ Ba 


对 于 正 态 异 型 ,可 由 似 然 比 导出 检验 统计 量 . 
_ max{L(Y, B, 2). B, so 
~ max{L(Y, hb, 之 ): Bo, 507° 


其 中 Bo 是 如 的 第 一 个 行 向 量 .由 定理 7.13 已 知 pa OtdetC Ry 
必 ] 全 exp | 一生 | 而 HH。 成 立时 
L(Y, 8。3)=O- (det3) 3.exp{- tr 
x 训 (ye-B) (ve Bo)'} 


注意 到 高 (ys-Bo)(yo-Bo)' = 局 (一 殉 ( 一 玖 
+n(g— Bo)Y-B)— YPLY 
+n(B Bo) BF- Bo)’, 


得 Ma~O. [det( Y'PLY/n)] 3? exp{ 引 - 


记 YP,Y-R， 有 和 一 (dot Ro/det Ri) ， 它 是 A a (detRo/ 
det RJ) 的 严 隆 函数， 因此 检验 的 否定 域 取 {A4<Oc}。 由 于 有 oo~ 
到 ,(n 一 q 一 1 加) 当 五 成 立时 , Ri 和 ~Woln 一 1, 了 ), 得 BR 一 RB&。 
与 Ro 独立 , 且 Ri— Ro~W,(g, 之 ), 故 有 

A~A(p, n—g—1, g). 
当 检 验 水 平 a 给 定时 ,可 查 表 得 净 界 值 O。. 

当 五 。 被 拒绝 ， 我们 接受 回归 模型 (7 .60), 与 一 元 情形 相仿 ， 

尚 需 检验 自 变 量 革 ; 的 效应 的 显著 性 , 这 时 要 检验 的 假设 是 

Ho: Bu=*…= By=0. 
念 上 用 似 然 比 检验 , 这 时 容易 验证 , 当 五 0 成 立时 , 作为 受 约束 模 
型 求 B 的 最 小 二 乘 估计 , 其 残 积 阵 为 Ri 一 了 'P, 了 ,其 中 im 是 在 


1) 窜 使 Bo 概率 为 1 地 非 在 异 , 要求 4 一 d 一 12p。. 
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(了 ) 中 划 去 下 的 第 宇 列 后 所 张 成 的 线性 空间 ， 于 是 有 Ru 和 ~ 
Wptn 一 9g, 到 4)， 当 假设 成 立时 , 我 们 有 Riu~W,(n-g, 写 )， 
Ie:— Ro~W,(i, 之 ). 于 是 有 


det RE。 ~ 
A det BR., 4 2， 名 9g 1, 1) 


由 表 7.1 知 , 令 了 一 二 了 全 了 2 名， 当 万 成 立时 有 


1 一 4 n-g—p ~F 
4 » 


Pn—PD—d 
故 得 水 平 为 a 的 检验 的 拒绝 域 是 
| AA-1>=1 十 2 “Fpn_p-a,a |. 
%—D—g 


注意 ,在 进行 这 一 检验 时 .我们 必须 限制 %%>>2 十 9， 

在 选择 变量 问题 上 , 多 元 线性 模型 的 情形 比 一 元 复杂 , 因为 车 
自 变量 蕊 , 对 整个 因 变 量 集 的 效应 即使 是 显著 的 (否定 互 ), 但 不 . 
见得 它 对 每 个 因 变 量 的 效应 都 显著 ， 从 而 可 提出 检验 参数 矩阵 8 
的 列 疝 量 是 否 为 零 的 问题 ， 如 果 为 零 意味 着 相应 的 因 恋 量 并 不 统 
计 依 赖 于 现 有 自 变量 因子 , 这 时 要 考虑 选 进 其 它 因 子 , 才 有 可 能 预 
报 这 一 因 变 量 。 另外 ， 一 个 自 变 量 虽 然 对 整个 了 的 效应 并 不 显 
著 , 但 对 某 个 因 变 量 仍 有 可 能 是 显著 的 ， 总 之 , 这 时 的 自 变 量 选择 
问题 变 得 错综复杂 , 如何 定 出 合理 的 选择 标准 ,给 出 相应 的 选择 方 
法 ,是 一 个 很 有 实际 意义 的 问题 ， 但 这 里 无 法 给 予 深 入 讨论 . 

现在 我 们 来 讨论 一 般 线性 假设 

互 o， HEG 0 的 检验 . 
这 里 及 是 xg 阶 阵 ,G 是 pxr 阶 阵 , 且 有 Yk HH=%,rkG=7r, 这 
类 假设 表现 了 多 元 线性 模型 参数 统计 推断 问题 的 特点 ， 如 单纯 考 
虑 已 召 =0 型 的 假设 , 实际 上 是 对 BB 的 列 向 量 所 张 成 的 空间 的 约 
束 , 它 完 全 可 以 从 一 元 检验 问题 平行 地 推广 过 来 ,但 当 假 设 为 BG 
一 0 型 ,就 是 约束 了 如 的 行 向 量 所 张 成 的 线性 空间 ， 这 类 检验 问 
题 在 一 元 统计 分 析 中 是 不 存在 的 ， 因 而 需要 寻求 特别 的 方法 去 检 
验 ， 然 而 后 一 类 型 的 检验 问题 可 以 通过 适当 的 变换 化 归 为 前 一 类 
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型 处 理 ， 
先 讨 论 检验 一 般 线 性 假设 
Ho HB=0 
我 们 只 想 说 明 如 何 将 一 元 线性 假设 检验 的 方法 平行 推广 过 来 ， 而 
不 详 述 推导 检验 统计 量 的 全 过 程 ， 注 意 到 景 小 二 乘 估 计 所 给 出 的 
估计 量 实际 上 可 按 列 分 别 给 出 ， 即 落 把 多 元 线性 模型 看 成 如 
全 -和 8) 的 2 个 一 元 线性 模型 ， 分 别 求 By 的 最 小 二 乘 估计 ， 然 后 将 
BB; 合成 一 个 矩阵 ， 恰 好 就 是 多 元 线性 模型 中 B 的 最 小 二 乘 估计 
如， 考虑 HB 一 0 是 一 个 约束 ,实际 上 也 是 HB1 一 … 一 HB, 一 0, 
所 以 求 多 元 线性 模型 (7.50) 在 约束 五 B 一 0 下 的 最 小 二 先 佑 计 
局 #， 也 可 以 分 别 考 虑 (7.49) 中 各 个 一 元 线性 模型 在 约束 HB;=0 
下 的 最 小 二 乘 估 计 , 故 有 及 By 一 Pxo 了 ,这 里 @ 是 一 个 4 阶 方 阵 ， 
使 得 w(@) = 六 (五 )、 实 际 上 可 取 
Q@=JIT—-H’'(HH’)-+He Pa, (7.65) 
它 是 到 pCH 人 的 正 交 补 空间 的 投影 阵 , (参看 8 6.5( 二 )) 记 Bi 的 
残 积 阵 为 Rp, 有 
R= YPyo.Y (7.66) 
从 而 仿 前 面 的 推导 可 得 似 然 比 一.M/UMr 是 
A det Ro 
det Er 
的 严 降 函 数 。 因此 ， 检 验 且 B-0 的 拒绝 域 是 {4<0,}. 根据 
$ 6.5( 二 ) 中 (6.73) 式 , 知 
rk Pxo:=—n— [rk( 4'!H’)—rk Han—s. 
其 中 sark( 脏 '1H') 一 tk H'， 因 此 , 当 Ho 成 立时 ， 
A~Ad(p, n—g, 9—s). 
它 只 有 在 特殊 情况 下 等 价 于 到 检验 , 一 般 就 要 查 4A- 分布 家 ， 从 
而 确定 水 平 为 & 的 检验 的 临界 值 . 
为 了 检验 假设 互 o: HBG 0, 我 们 令 
Z-YG, @=BG, 
模型 (7.50) 就 变 为 
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Z=XO+eG (7.67) 
EG~N(0, 了 G'BG) (7.68) 

假设 五 : HBG=0 就 变 为 z 

f,. HO@-0 
从 而 可 仿 上 面 讨论 得 到 在 模型 (7.67) 下 检验 五。 的 检验 统计 量 是 

A~det(Z’'PrZB)/det(Z'Pxyo 2Z) 
共和 中 人 入 如 人 .65) 定 义 ， 由 原 模 型 数据 表 出 就 是 
A~det(G’Y’PxYG)/det(G'Y'Pxon TG). , 
当 假 设 五 。 成 立 , 有 
A~A(lr, n—g, 9—s) 

其 中 s=rk( 耻 1 有 H') 一 rk HH', 其 余 同 上 . 

在 讨论 假设 检验 时 ， 有 一 个 常用 的 方法 是 将 模型 化 为 某 种 典 
型 的 型 式 , 称 为 法 式 ， 在 法 式 下 检验 问题 变 得 十 分 明确 ,使 于 进行 
讨论 。 这 种 方法 是 由 许 宝 又 教授 在 1941 年 提出 的 , 它 在 讨论 五- 
检验 的 优良 性 时 起 了 明显 的 作用 . 

最 后 我 们 来 讨论 广义 方差 分 析 .。 车 一 元 统计 分 析 中 ,对 于 一 
些 狭 义 的 方差 分 析 模 型 (一 向 分 类 ,两 向 分 类 模型 等 ), 用 方差 分 析 
方法 去 检验 因子 效应 的 效 著 性 有 明显 的 方便 之 处 ， 它 可 以 通过 简 
单 的 和 式 与 乘积 的 计算 去 实现 ,在 多 元 统计 分 析 中 , 它 的 自然 的 扒 
广 就 是 广义 方差 分 析 ， 实 际 上 也 就 是 将 观察 值 怎 阵 的 “乘积 和 2?” 阵 
了 了 进行 分 解 , 如 

Y'Y-> WwW, 


这 里 厂 , 是 一 些 相互 独立 的 遵从 Wishart 分 布 的 随机 矩阵 , 根据 
Qochran 定理 到 矩阵 情形 的 推广 (看 定理 7.5)， 利 用 Wilks 统计 
量 4, 可 按 分 解 式 进行 一 些 有 关 的 检验 . 
例如 考虑 两 向 分 类 模型 ， 
yy= Oot Bit yit ey, 4 一 二 03 7 一 工 », C. 《7.69) 
其 中 yy, bo By 5w 都 是 pp 维 向 量 ， 仿照 对 (6,50) 的 方差 分 
析 , 我 们 易 得 分 解 式 
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YY-y YY + Oi.—¥) Ys:.—Y) 十 之 7 一 ¥) YY)" 
士 之 PA CL — Bt) Vy— Ym Yt 
Wot Wi+ Wt 下。 
1 1 < i 工 芝 网 、 
其 中 8V 一 名 Vy, Yr ~ PA Ys 欲 检 验 假 设 
Ho: Bi=:…=B.,=0, 


H os. 71 一 … 一 yo 一 0. 
检验 互 oi 的 统计 量 可 取 
def WW 


~ det(W.+ W.)’ 
检验 互 o 的 统计 量 可 取 
det 作 。 


4 TW Wy 
当 零 假设 成 立时 , 它们 分 别 遵从 4- 分 布 ， 从 而 可 仿 前 面 的 做 法 给 
出 检验 . 
一 般 地 说 ,广义 方差 分 析 总 可 以 由 方差 分 析 导 出 .， 这 是 因为 
在 Wishart 着 阵 入 宝生 亲 存在 首肯 在 下 二 ， 欲 给 出 多 元 线 
性 模型 中 了 站 的 分 解 式 


IT~ 包 YFP.Y (7.70) 
则 可 考 钻 向 量 Ya 的 模型 
Ya= XBatea (7.71) 
记 2Z= Yq, 如 有 2Z'Z 的 分 解 式 
2ZGF- 冯 PP G (7.72) 


满足 Br 一 庙 十 … 十 jx, 这 里 十 表示 正 交 直 和 ， 表 示 对 (7.71) 可 用 
方差 分 析 方 法 . 那么 也 就 有 与 (7.72) 相 应 的 (7.70) 式 . 因为 这 里 的 
关键 总 将 空间 作 正 交 直 和 和 分解 .如 果 对 (7.72) 能 作出 明确 的 统计 
解释 , 则 可 将 此 解释 搬 用 到 (7.70) 去 , 从 而 得 到 广义 方差 分 析 . 
附注 ， 广 义 方 差 是 方差 概念 的 推广 ， 它 一 般 指 随机 向 量 的 协 
方差 阵 的 行列 式 , 也 可 定义 为 协 方 差 阵 的 迹 或 最 大 特征 值 ， 从 而 
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可 称 样本 协 方差 阵 的 行列 式 为 样本 广义 方差 ， 这 里 的 广义 方差 分 
析 就 因此 而 得 名 


$7.4 随机 向 量 的 互 依 性 


在 上 一 节 的 回归 分 析 中 ， 我 们 讨论 了 一 组 随机 变量 对 另 一 组 
随机 变量 的 统计 依赖 性 .本 节 将 以 随机 向 量 的 互 依 性 作为 研究 对 
象 , 并 从 而 得 到 一 些 实用 的 多 元 统计 方法 . 所谓 互 依 性 , 就 是 把 一 
个 随机 向 量 的 各 分 量 之 间或 两 个 随机 向 景 之 间 的 统计 联系 认为 是 
相互 的 ,而 不 是 与 自 变量 和 因 变 量 的 关系 相仿 的 依赖 性 . 在 得 到 
了 一 批 样 本 观察 值 , 但 并 不 了 解 变量 之 间 的 关系 时 ,从 互 依 性 的 角 
度 去 分 析 这 些 观察 值 , 似乎 是 更 合理 的 . 

研究 互 依 性 的 目的 ， 是 找 出 随机 向 量 或 随机 变量 之 间 的 主要 
联系 . 从 统计 的 角度 看 , 就 是 要 突出 一 组 指标 中 起 着 主要 作用 的 
成 分 (可 能 是 这 组 指标 的 某 个 函数 )， 从 而 可 在 实用 中 减少 指标 的 
个 数 ( 降 低 维 数 ), 但 不 会 造成 明显 的 损失 . 另 一 方面 , 观察 值 之 间 
(变量 之 间 ) 的 相互 依赖 ,有 时 会 给 统计 处 理 和 统计 解释 带 来 困难 ， 
因此 ,考虑 对 它们 作 一 定 的 变换 ,使 之 相互 独立 ,或 作 某 种 分 解 ,使 
统计 解释 比较 容易 进行 ,在 实践 中 也 是 有 意义 的 . 

下 面 我 们 分 段 讨论 在 互 依 性 方面 常用 的 几 种 统计 方法 ， 主 成 
分 分 析 , 典型 相关 和 因子 分 析 . 


(一 ) 主 成 分 分 析 
在 对 其 个 实际 的 多 元 统计 分 析 问 题 进行 讨论 时 ， 事 先 很 可 能 
不 了 解 问题 所 涉及 的 多 个 指标 之 间 的 互 依 性 ， 为 了 获取 充分 的 信 
息 从 而 作出 较 可 靠 的 推断 ,我 们 往往 选择 许多 个 指标 去 进行 观测 ， 
这 些 指标 甚至 多 到 十 几 个 、 几 十 个 , 然而 , 这 些 指标 的 意义 究竟 如 
何 ， 是 否 可 以 剔除 一 些 意义 不 大 的 指标 或 考虑 引进 更 能 说 明 问 题 
的 综合 指标 ,无 疑 是 值得 探讨 的 ， 例 如 在 服装 定型 的 研究 中 ,有 人 
对 256 个 成 年 男人 的 体型 按 16 项 指标 进行 了 测量 , 经 过 主 成 分 
。 351 . 


分 析 , 最 后 确定 选择 三 个 主 成 分 作为 定型 的 依据 , 从 而 使 定型 工作 
既 简 单 易 行 , 及 有 充分 可 告 的 根据 ， 又 如 要 反映 物价 情况 , 对 各 种 
物价 作 全 面 调查 固然 可 说 明 物 价 情况 ， 但 物价 之 间 明 显存 在 互 依 
性 , 实际 上 选择 几 种 主要 商品 的 价格 或 得 到 某 些 综合 指标 , 就 可 能 
足以 反映 物价 的 情况 。 有 人 对 土壤 标本 进行 研究 , 测 了 五 项 指标 ， 
经 过 主 成 分 分 析 , 发 现 其 各 项 指标 主要 是 由 其 中 的 两 项 所 控制 .这 
些 情况 都 表明 ,在 对 数据 进行 统计 分 析 之 后 , 事先 考虑 观测 的 众多 
指标 并 不 都 是 必要 的 , 有 时 有 大 大 压缩 指标 维 数 的 可 能 ,这 样 不 但 
在 经 济 上 能 节约 开支 减少 观测 ， 更 重要 的 或 许 是 使 得 要 矛盾 突 
出 ,有 利于 解决 实际 问题 . 

主 成 分 分 析 就 是 为 了 解决 上 述 问 题 而 引进 的 统计 方法 ， 它 首 
先 由 Hotelling 于 1933 年 提出 ， 从 纯 理 论 的 角度 看 , 这 个 方法 是 
清晰 易 行 的 。 它 考虑 对 随机 向 量 及 一 (于!,…, 及)’ 作 正 交 变 
换 ， 令 y 一 UX, 这 里 品 是 正 交 阵 ， 一 方面 使 y 有 较 简 单 的 协 方 
差 阵 , 如 对 龟 阵 ， 于 是 y 的 各 分 量 是 不 相关 的 ， 这 时 4 的 各 个 分 
量 在 整个 变异 中 的 作用 就 很 容易 衡量 (下 面 将 给 出 定义 )， 这 就 使 
得 我 们 有 可 能 从 gy 的 分 量 中 选择 主要 成 分 ， 吻 除 影响 微弱 的 部 
分 ,也 可 以 通过 g 的 主 成 分 的 构造 去 分 析 原 来 的 至 的 各 个 分 量 的 
作用 .然而 ,在 将 主 成 分 分 析 应 用 于 实际 问题 时 , 量 纲 和 尺度 的 问 
题 会 引起 麻烦 。 如 果 有 一 些 指 标 具 有 不 同 的 量 纲 ,要 对 这 些 指标 
求 线性 组 合 得 综合 指标 , 综合 指标 究竟 反映 什么 呢 ? 严 格 地 说 不 同 
量 纲 的 数 是 不 能 相 加 的 ， 沉 且 , 即使 形式 上 可 以 求 和 ,尺度 的 选取 
将 改变 结果 , 而 究竟 该 取 怎 样 的 尺度 则 因 量 纲 不 同 而 无 统一 标准 . 
在 主 成 分 分 析 中 解决 这 一 问题 的 办 法 ， 是 将 每 个 指标 值 除 以 它 的 
标准 差 , 从 而 化 成 无 量 纲 的 纯 数量 .这 似乎 是 一 种 可 循 的 办 法 , 可 
是 ， 也 可 以 提出 如 下 间 题 ， 如 脏 一 (及 1, …， 斑 ,)' 是 对 人 体 体型 
的 2 个 特征 的 测量 , 量 纲 都 是 长 度 ， 譬如 说 身高 是 150 厘米 到 200 
厘米 , 脚 长 是 二 厘米 到 30 厘米 , 如 此 等 等 , 把 这 类 数据 除 以 相应 
的 标准 差 是 否 比 不 除 标准 差 更 合理 呢 ? 这 很 难 从 理论 上 给 出 回答 ， 
但 结果 却 可 能 很 不 相同 ， 如 何 去 解释 结果 的 差异 呢 ? 这 看 来 是 一 
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个 坏 手 的 问题 ， 对 这 类 问题 的 处 理 ,单纯 从 理论 上 无 法 解决 , 悉 怕 
要 依靠 对 问题 的 实际 知识 . 

下 面 , 我 们 在 假设 下 的 总 体 二 阶 矩 已 知 的 条 件 下 ,从 数学 的 角 
度 把 这 个 问题 探讨 清楚 ， 设 Oov' 下 一 王 . 那么 ,欲求 正 交 阵 也 使 
得 89 一 了 7 对 的 协 方差 和 矩阵 为 对 角 阵 ， 且 使 主 对 角 元 按 其 次 序 由 大 
到 小 排列 ， 实际 上 正 是 全 诈 代数 中 将 区 衬 0 化 为 对 角形 的 问题 ( 见 
附录 A.4. 1), 即 

Covy= UCovAU= USU=A4, (7 .78) 

4 是 对 角 阵 diag (和 1, ha …， 和 gp), 其 中 和 宇和 Np… 之 hp 之 0、 如 末 
协 方差 阵 之 的 秩 rE 宇 =, 则 有 和 > 和 it 一 0. 这 里 ) 是 之 揭 特 征 
信 , 记 U= (WU…UrWUrii…Wp), 则 ws 正 是 之 的 相应 于 和 %‰ 的 特征 向 
量 , 有 之 绍 一 it 一， ……，2， 如 果 特 征 值 中 有 一 部 分 为 零 ( 在 这 
里 就 是 和 ti 一 … 一 和 Wp 一 0), 意味 着 Yrri,…,Yp 是 没有 变异 的 ,这 些 
分 量 就 不 必 在 统计 中 予以 讨论 . 一 般 地 说 ， 也 不 一 定 退 化 ， 但 可 
能 仍 有 一 些 特征 值 相 对 地 很 小 ,这 表明 2 在 某 些 方向 变异 很 小 ， 
可 形象 地 认为 象 一 欣 被 压 遍 到 几 近 平面 的 空间 图 形 ， 其 厚度 可 予 
忽略 ,并 近似 地 当 作 平面 图 形 来 考虑 . 

定义 ?9.3 

设 及 是 p 维 随机 向 量 , U 是 正 交 和 矩阵, 使 得 了 UVU' 生 具有 如 
(7.73) 的 协 方差 阵 ， 则 称 yi 是 (关于 脏 的 ) 第 主 个 主 成 分 ，i=1， 

,7， 称 /如 入 是 第 个 主 成 分 的 贡 洪 率 , 称 疏 和 %/ 习 入 是 前 

个 主 成 分 的 累计 贡献 率 . 

由 于 级 一 纳 了 于 ,所 以 一 个 主 成 分 对 应 着 之 的 一 个 特征 向 量 .% 
的 方差 D8)= 机 之 t4 一 入 反映 了 坟 的 变异 ， 由 于 y= (y1, 
yr)' 的 分 量 是 互 不 相关 的 ( 当 下 有 正 态 分 布 ,就 是 相互 独立 的 )，9 
的 变异 由 为, …，) 反映， 贡献 率 的 概念 刻 划 了 yi 的 变异 在 整个 
变异 中 的 地 位 ， 按 照 我 们 的 定义 ,第 一 主 成 分 的 贡献 率 最 大 , 并 依 
次 递减 ， 如 果 前 天 个 主 成 分 的 累计 贡献 率 已 接近 100%， 那么 ,用 
这 上 天 个 主 成 分 作 指标 , 比 起 用 原来 2 个 指标 (及 ), 其 反映 实际 问题 
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的 能 力 已 几乎 一 玖 ， 这 就 使 问题 可 从 吧 维 空间 降低 到 维 空间 来 
讨论 (一 般 有 <p)。， 在 实际 应 用 中 ,当前 《个 主 成 分 的 累计 贡献 
率 达 85% 以 上 ,就 认为 这 个 主 成 分 已 足够 反映 原 回 量 的 变异 . 
我 们 还 可 从 另 一 理论 角度 去 解释 下 的 信息 为 什么 已 经 包含 
在 关于 于 的 了 个 主 成 分 中 , 现在 考虑 用 性 的 个 线性 函数 玉生 ， 
…, 忆 下 对 他; 作 线性 预测 ,这 里 (4 下, …, Bb 下 )' 是 非 退化 的 ， 即 
车 记 B= (be…B%)， 有 CovB' 和 ~B'2B>0. 要 求 预 测 的 均 方 
误差 最 小 , 记 这 个 最 小 均 方 误差 为 
HB'X) -min E(T;— B'BX), j=1, “人 
我 们 有 
定理 了 .14 
设 gi, ”7 WX 是 关于 .4 的 前 £ 个 主 成 分 ， 记 UU = (ts, "ny 
Ur) (有 如 =( 品 : os) 满 足 (7 .73))，、 则 有 
> ID = min (BP'TX) ‘7.74) 
一 Tk 玉 = 有 j= 
证 由 第 6 章 86.2 的 定理 6.2 知 ， 

CB'R)= DCR) -Cov XR,, BX) BEB)-!Cov(X,, BY) 
因此 加 BX)-tr 2-tr 3B(B'DB)-+B'D. 
欲 证 (7.74), 只 需 证 

tr BU(UBU) D3-marir SB(B'SB):B'S 

: (7.75) 
注意 到 
tr EUCUSU)U SirU AA A UD -tr UAiUi = 六 %, 


Ai 1 
其 中 4-( 2 ) M 是 之 的 第 名 个 顺序 特征 值 ， 由 于 2?B 


(B'S5B) -B'S? 是 到 以 ( 汪 : B) 的 正 投影 阵 , 由 A.6.2, 存 在 正 交 
阵 人 的 前 + 列 六 满足 
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BB(BSEB-B DEI- VV, ViV=l,, 
于 是 tr BB(B'SB)-B' Dtr Di VVD: -tr VD, 
根据 A.4.3 得 px trV'> 两 ~ 习 人 在 = UU 时 达到 . 证 毕 ， 
记名 = 世人 这 里 条 = 《41,…, Yrx)'"。 我 们 有 
xk x 2 
X= 禄 Wdiy D(X,) 一 禄 Uy Ns, 


Pp Pp 
而 全 /一 宛 Wyy, DLT) -名 2 


从 而 可 见 完 , 的 方差 是 了 ;的 方差 的 一 部 分 ,其 所 占 比例 为 > 2 
/ 训 win, 这 个 比例 如 果 较 接近 于 1 就 意味 着 用 前 个 主 成 分 的 
信息 , 能 基本 上 “包含 " 卫 ; 的 信息 ， 由 于 在 比例 式 中 起 作用 的 不 仅 
仅 是 为, 妈 亦 可 起 显著 影响 ， 故 称 ws 为 互 ; 在 主 成 分 了 ;上 的 载 
荷 ， 对 于 载荷 的 分 析 , 在 实际 应 用 时 是 很 重要 的 . 
应 用 中 常 考虑 将 主 成 分 标准 化 ,即将 y 除 以 它 的 标准 差 Vn， 
”从 而 使 D(YW/VM)=1. 记 户 = 了 /ww , 则 有 CovGp) 一 到 ,由 
Mm 0 
Fe | * 六 UAiF 
0 VM 
- 可 得 全 ,在 标准 化 主 成 分 方 上 的 载荷 为 ww ， 记 ou 一 zy。 有 
D(ZO- 为 吃 DCZED- 禄 咏 故 对 标准 化 主 成 分 而 言 ， 载 荷 的 
意义 更 为 明显 ， 事 实 上 我 们 有 : 在 号 一 民 是 相关 矩阵 时 ， 
0y= p(X,, 了 了 (于 ， 与 Y; 的 相关 系数 ). 
还 可 以 考虑 将 了 旋转 , 即 以 阶 正 交 阵 夏 去 作用 , 令 g 一 厂 耻 , 则 有 
泡 - UA3 Tg, 仍 有 D( 守 一 交 ,但 这 时 下 ,在 上 的 载荷 变 为 
Bu 全 训 cuyw, 其 中 yw 是 了 的 (, 四 元 ， 
适当 选取 工 ,有 可 能 对 问题 作出 更 好 的 统计 和 解释，: 
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在 实际 进行 主 成 分 分 析 时 ， 总 体 的 协 方差 阵 或 相关 矩阵 是 不 
大 可 能 知道 的 , 那 时 总 是 从 nw 个 p 维 观察 值 出 发 ,用 样本 协 方差 阵 
乡 或 样本 相关 和 矩阵 下 去 进行 分 析 , 在 寻求 主 成 分 的 程序 上 并 无 差 
别 , 但 在 对 结果 作 理 论 分 析 时 涉 五 六 特征 值 .特征 向 量 都 是 随机 
变量 ,这 就 使 推导 变 得 十 分 困难 ， 特征 值 的 分 布 昌 可 在 一 定 条 件 
下 导出 ,但 已 超出 本 书 的 范围 . 
在 使 用 样本 协 方差 阵 作 主 成 分 分 析 时 ， 对 主 成 分 可 作出 有 趣 
的 几何 解释 , 设 ww 个 观察 点 为 zi，…，2w。 我 们 取 这 % 个 点 的 恒心 
1 
二 了 wv, 为 原点 , 即 假定 数据 阵 zo| : jaa 以 该 列 的 平均 
In 
信 为 起 始点 ， 即 以 wy 一 二 总 mo 代替 su。 这 时 样本 协 方差 阵 就 
是 -二 -于 县 , 记 于 时 一 C, 现 在 我 们 要 找 一 条 直线 (通过 原点 , 方 


问 为 2 一 JTJ)， 使 兄 个 点 NY, …， ww, 到 此 直线 的 有 距 离 下 方 和 最 
小 容易 看 出 w, 到 此 直线 的 距离 平方 是 wiw; 一 XiUu'w:， 因 此 ， 
问题 就 是 要 极 小 化 


S,(, u)a CA 一 和 0 人) ~trA Eu. 
《一 。 


上 式 的 极 小 值 点 显然 是 至 ' 玉 的 相应 于 最 大 特征 值 的 特征 向 量 
ai。 故 由 纳 w 为 第 一 主 成 分 的 直观 理由 就 很 明显 , 即 数据 在 这 
个 方向 上 有 最 大 的 变异 ， 接 着 就 是 在 与 us 正 交 的 线性 空间 ( 当 原 
点 不 是 重心 时 ， 是 通过 重心 与 妈 正 交 的 超 平面) 中 以 类 似 上 述 方 
法 找 一 条 直线 ， 这 条 直线 的 方向 u(tstWs 一 1) 正 好 对 应 着 第 二 主 
成 分 到 下 , 如 此 等 等 

烦 便 指出 ， 这 里 问题 的 提 法 与 线性 回归 不 同 。 如 考虑 系 : 对 
互 :，…, 下 ,的 线性 回归 , 它 要 寻求 一 个 超 平面 (p 一 1 维 ) 使 得 % 个 
点 沿 着 第 一 个 坐标 轴 的 方向 到 此 超 平面 的 距离 平方 和 最 小 ， 它 是 
沿 一 个 事先 固定 的 方向 计算 距离 ， 与 主 成 分 分 析 的 几何 解释 中 计 
算 点 到 超 平面 的 垂直 距离 不 同 ， 这 在 p=2 时 很 容易 用 图 形 说 明 ， 
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(二 ) 因 子 分 析 

因子 分 析 方 法 被 认为 开端 于 1904 年 C. Spearman 的 著名 论 
文 ， 他 在 分 析 中 学 一 个 班级 的 学 生 的 六 门 功课 成 绩 时 发 现 ,六 个 
随机 变量 实际 上 可 分 解 成 如 下 形式 ， 


化 人 Bi 
| 有 | Ia 上 (7.76) 
we Co 86 


这 里 了 是 对 每 个 2 都 起 作用 的 变量 , 64 只 对 w 起 作用 ,w 是 常数 ， 
称 这 样 的 了 为 x 的 公共 因子 , 8, 是 特殊 因子 . 又 如 考虑 人 的 生理 
指标 ， 设 为 收缩 压 ` 舒张 压 、 心跳 间隔 、 呼吸 间隔 、 知 下 温度 等 五 
项 , 从 生理 学 获知 这 些 指标 至 少 受 植物 神经 的 影响 , 而 植物 神经 又 
分 交感 神经 和 副交感 神经 ， 因 此 这 两 项 可 作为 以 上 生理 指标 的 公 
基因 了 ,至 于 还 有 没有 其 它 公 共 辣 于 网 震 作 这 一 抄 分 人 一 般 地 
有 

1 一 4 了 f 十 es 一 一 公共 因子 ,e 一 一 特殊 因子 。 《7.77) 


Px1 pxXaxli1 
并 且 有 理由 假定 : 
(i) g<%»; 
Qi) 了 与 8 不 相关 , 即 
Cov(f, 8) 一 0; 《7.78) 
(iii) Covf =L,, Cove=diag(o?, .…, o?)a4. 
这 类 假定 主要 出 于 数学 处 理 的 需要 ， 但 在 不 少 销 形 下 也 可 出 实 际 
问题 作出 解释 . 
. 对 指标 进行 这 样 的 因子 分 析 ， 从 而 明确 对 所 有 指标 都 有 影响 
的 某 些 公共 因子 , 并 确定 只 对 某 个 指标 起 作用 的 特殊 因子 ,在 实践 
中 当然 是 有 意义 的 ， 这 使 得 我 们 在 处 理 有 关 问 题 时 能 采取 更 合理 
的 措施 , 并 常 可 使 维 数 降低 ， 
下 面 我 们 对 满足 假定 (7.78) 的 模型 (7 .77) 作 一 些 理论 探讨 。 
计算 w 的 协 方差 阵 , 有 
Covw=AA’+4 (7.79) 
可 见 
[9357 


Do) = a2 +o?, 


得 wm 的 方差 是 由 两 部 分 组 成 的 ， 一 部 分 是 4 的 第 纪行 向 景 4 
的 范 数 平方 law?， 它 由 公共 因子 的 系数 矩阵 决定 ， 男 一 部 分 cf 
是 第 个 特殊 因子 的 方差 . 如果 oo 较 小 , 则 D(wo) 主 要 由 公共 因 
子 的 影响 决定 。 记 如 一 |awl?, 用 它 来 表明 公共 因子 对 z4 的 影响 
. 的 大 小 。 在 极端 情形 , 当 os 一 0, 表明 w 完全 由 公共 因子 决定 ; 当 
及 一 0, 4 的 第 放行 为 0, w 是 不 依赖 公共 因子 的 , 它 完全 由 特殊 因 
子 决定 . 称 站 为 公共 因子 了 对 ww 的 贡献 . 考虑 公共 因子 中 方 对 
x 的 影响 不 难看 出 ， 这 种 影响 是 通过 4 的 第 3 了 列 表现 的 ， 记 gi 一 


加 咯 , 称 好 为 公共 因子 中 的 广 对 we 的 贡献 ， 如 同 主 成 分 分 析 中 


相仿 ， 称 ow 为 第 世人 个 指标 w 在 第 了 个 公共 因子 方 上 的 载荷 。 使 
9# 达 最 大 的 公共 因子 fi 是 最 重要 的 公共 因子 ， 使 如 达 最 大 的 指 
标 m4 是 对 公共 因子 依赖 最 大 的 指标 ,而 载荷 ci 在 D(z 二 D(C 有 i) 
一 上 时 , 丛 好 是 zm 与 广 的 相关 系数 plm, 及 )。 在 实际 工作 中 往往 
希望 载荷 相对 集中 , 这 样 便于 分 析 指 标 和 公共 因子 的 关系 。 习惯 
上 称 息 为 载荷 矩阵 ， 为 方便 起 见 ,我 们 不 妨 设 它 的 列 已 按 对 多 的 
贡献 的 大 小 次 序 排 好 , 即 gi 之 … 之 gia, 

一 个 关键 的 理论 问题 是 求 出 载荷 矩阵 4 在 较 强 的 假定 下 ， 
这 是 容易 做 到 的 ， 设 w 已 经 标准 化 (即使 每 个 分 量 的 方差 为 1)， 
它 的 协 方差 矩阵 Oov 2 一 吾 就 是 相关 和 矩阵 ， 设 及 自已 知 则 
及.s 民 一 4 称 为 约 相关 阵 . 由 约 相关 阵 玉 .一 44' 不 难 定 出 
丰满 足 前 面 的 要 求 .在 这 种 情形 下 我 们 当然 要 有 及 ,>0( 非 负 定 )， 
用 附录 A.4.3 中 的 谱 分 解 , 有 : 


R,—2 uu r=rk BR,, 
其 中 gy 是 ,的 相应 于 特征 值 为 的 规范 化 特征 向 量 ( 即 | 一 
1), 和 之 … 之 和 >>0， 于 是 , 取 
dj; — MN Wy, j=1, "**, 0, 就 有 A=(gi, “ga) 
为 欲求 的 系数 矩阵 ， 这 样 求 得 的 4 还 满足 
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Mm 0 
.A'A= 和 ,有 好 一 ji j=1, …, 9. 


位 

在 上 述 情形 下 , 因子 分 析 似 与 主 成 分 分 析 无 多 大 差别 . 但 在 
主 成 分 分 析 中 ,是 去 寻求 相关 算 阵 屁 的 前 个 特征 向 量 , 而 在 因 
子 分 析 中 则 从 约 相 关 阵 召 . 出 发 , 这 是 不 同 的 、 为 了 保证 吾 , 是 非 
负 定 阵 , 我 们 必须 限制 4 一 diag(o1, …, o7) 在 一 定 的 范围 内 .并 
且 , 在 主 成 分 分 析 中 要 寻求 的 加 是 各 列 正 交 的 ,但 对 如 却 元 此 约 
束 , 因 而 这 里 的 解 是 不 完全 确定 的 . 

根据 号 ,一 自 44' 去 求 4， 解 虽然 并 不 唯一 ,但 由 附录 A.4.6， 
如 BB' 一 44'’， 则 有 B= A 中 ,这 里 六 是 g 维 正 交 阵 . 因此 解 的 
空间 人 Q) 是 唯一 的 , 称 为 因子 空间 , 而 且 任 一 解 均 可 由 上 面 已 求 
得 的 4 经 过 旋转 ( 右 导 一 正 交 阵 ) 而 得 。 经 过 旋转 之 后 , 公共 因子 
对 zw 的 贡献 加 并 不 改变 , 但 公共 因子 本 身 就 可 能 有 较 大 变化 , 即 
好 不 再 与 原来 相同 ， 从 而 可 通过 适当 的 旋转 去 得 到 使 我 们 比较 称 
心 的 公共 因子 . 

经 过 旋转 , 可 将 模型 (7.77) 记 为 

V 一 (4 (十 2 人 2 二 8 《7 .80) 

这 里 2- 了 了. 
如 同 在 主 成 分 分 析 中 相仿 ， 我 们 希望 各 个 因子 的 贡献 越 分 散 . 越 
好 , 即 尽 可 使 得 有 较 多 的 载荷 为 零 或 接近 于 零 ,使 各 个 因子 的 影响 


分 别 体现 在 部 分 指标 上 ， 注 意 到 六 中 一 妨 4.4' 是 不 因 旅 转 而 影 


响 的 ， 因 此 ， 旋 转 后 贡献 的 分 散 程度 可 由 各 个 列 的 样本 方差 来 体 


bi1 Dis 
B-AT-| : . (7.81) 


bm bpa 
为 了 消除 符号 不 同 的 影响 ， 并 消除 各 个 指标 对 公共 因子 的 依赖 程 
度 的 影响 ,考虑 以 25/ 外 代替 55, 令 | 
.359. 
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gS. 
寻求 本 使 S 极 大 化 . 这 样 的 旋转 称 为 方差 最 大 的 正 交 旋转 . 因为 
S 仅仅 是 旋转 角 的 弧度 9 的 函数 ,这样 的 正 交 旋转 不 难 求 出 , 为 节 
省 篇 幅 贸 作 练 习 ， 当 g>>2 时 , 可 配对 逐步 进行 , 必要 时 反复 若干 
次 , 尽 可 能 取得 较 满意 的 效果 .这 方面 的 实例 可 参看 肯 德 尔 < 多 元 
分 析 > 第 4 章 . 


(7.89) 


(三 ) 典 型 相关 

前 面 我 们 讨论 了 随机 向 量 分 量 的 互 依 性 ， 给 出 了 主 或 分 分 析 
和 因子 分 析 方 法 ， 在 本 段 中 , 我 们 将 讨论 两 个 随机 向 量 之 间 的 互 

在 刻 划 两 个 随机 变量 的 互 依 人 性 时 , 引进 了 相关 系数 的 概念 , 它 
反映 两 个 变量 线性 相关 的 程度 .在 讨论 回归 时 ,我们 引进 了 变量 了 
和 向 量 气 之 间 线 性 相依 程度 的 刻 划 量 , 称 为 多 重 相关 系数 或 称 复 
相关 系数 .志和 并 的 复 相 关系 数 定义 为 了 和 下 的 线性 函数 0' 玉 
间 的 相关 系数 PC ,，G@' 入 ) 的 极 大 值 , 记 为 py,x。、 当 pr,x 较 大 时 ， 
用 三 对 入 的 线性 回归 来 预测 了 的 精度 就 高 ; 反之 , 工 瑾 焉 的 线 
.性 相依 性 就 不 紧密 ,了 就 不 宜 用 下 的 线性 函数 来 预测 百 见 线性 
相依 性 的 研究 有 实际 意义 . 

把 线性 相依 性 推广 到 两 个 随机 向 量 之 间 , 应 归功 于 Hotelling 
(1936). 他 引进 了 典型 相关 的 概念 如 下 . 

定义 了 .4 

设 且 一 (及 1, “> 在 四/ 和 了 = (YF, …， 了 是 两 个 随机 向 
量 , @' 半 和 BY 是 站 和 了 的 两 个 任意 的 线性 函数 , 为 确定 起 见 ， 
设 它们 的 方差 都 是 1, 即 D(a 人 )=DBY)=1. 记 pl@’X, b'Y) 
是 @' 半 与 6'F 的 相关 系数 ， 如 果 @i, 1 满足 D(ai 午 ) 一 DC(B1Y) 
一 1， 旦 

pl@aiX, BT)= ma pa'¥, 6'F) (7.83) 


Dia'X)= D@， Y)=1 
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则 称 p(q4 下 ,天 2 是 下 与 工 的 (第 一 ) 典 型 相关 系数 , 称 @i 到 和 
b1 了 是 卫 , 了 的 (第 一 组 ) 典 型 (相关 ) 变量 ， 在 不 致 混 清 时 简 记 px 
=p(a'R, biY). 

从 实际 观点 看 ,pi 反映 了 基于 及 的 综合 (线性 组 合 ) 指 标 和 基 
于 了 的 综合 指标 间 的 最 大 相关 程度 ， 它 也 是 肚 和 卫 的 互 依 性 的 
刻 划 . (这 里 的 互 依 性 是 指 某 种 没有 精确 定义 的 线性 互 依 性 , 因为 
我 们 并 未 讨论 及 的 任意 函数 和 了 的 任意 函数 之 间 的 相关 系数 .) 

在 症 和 了 的 联合 二 阶 矩 已 知 时 ， 典 型 相关 系数 和 典型 相关 
变量 组 的 推导 是 不 难 的 .事实 上 , 设 


不 之 之 
cov( 7)-(s By ) Dxx Dyy>0 (7.84) 
| YX YY ' 
任 给 线性 函数 ' 坟 与 FY, 有 | 
PC 下， b’ 了 ) 一 d'sxyb = b'Zyxa. (7 .85) 


它 在 条 件 @ 宛 xxa 一 byyb 一 二 即 D(a 半 ) 一 D(BWY) 一 1) 下 的 
z 极 大 值 显然 可 用 Lagrange 和 一 乘 子 法 求 出 。 令 


pla, 6)—a Txyb — F(a Bxxa 一 1) 一 (bE 0—D)., 


容易 验算 


加 全 : —Bxy0 iSxxt, 


OP ~、 . =2yxd— Loyyb. 


邻 E~0， 52~0, 在 原 条 件 下 易 见 


A=—u~@ Dxvybap, 
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并 得 

Wia a SikDxy TI Eyxa= pa, 

Wsa a SyyPDyxZxXOxyb= pb. 
由 附录 A.5.4 知 Wi 与 王 * 有 相同 的 非 零 特征 值 . (7.86) 表 明 
pa 是 和 死 的 特征 值 ,而 @, 65 分别 是 太 : 和 卫 s 的 相应 于 特 
征 值 p2 的 特征 向 量 ， 设 Wi 和 研 3 的 非 零 特征 值 的 个 数 ( 包 括 重 
数 ) 是 7 个 。 则 pCa, 8) 有 ?7 个 稳定 点 , 有 7 个 局 部 极 值 |pi| 宕 … 
之 |pr|>0, 其 中 |pi| 为 极 大 值 ， 它 正 是 我 们 欲求 的 芋 与 于 的 典型 
相关 系数 ,而 相应 于 的 你 :和 Wi 的 特征 向 量 gil, 本 就 给 出 了 
典型 相关 变量 组 1 对 ,61 开 ( 注 意 我 们 约定 了 D(aiX)=D(Bb1Y) 
一 1)。 这 里 q1, Bb 除 方 向 可 以 相反 外 一 般 是 确定 的 ( 当 pi 一 pi, 它 
分 训 可 在 一 个 2 维 的 线性 空间 中 任 了 到 ， 但 这 种 情形 出 现 的 概率 为 
零 ,可 予 忽略 )， 按 定义 典型 相关 系数 应 取 正 值 . 

在 应 用 时 ， 一 组 典型 相关 变量 可 能 不 足以 反映 下 和 王 之 间 
的 互 依 性 ， 有 时 需要 讨论 它们 的 较 只 个 综合 指标 ， 为 此 ， 我 们 称 
1oi| 为 第 和 个 虹 型 相关 系数 ， 相 应 于 py 的 Wi 和 Ws 的 特征 向 量 
0 0 给 由 的 变量 四 下 ,个 王 称 作 第 4 组 典型 相关 变量 ,一 二 …， 
六 。 为 方便 计 , 取 p 为 正 值 . 

可 在 gj，…，9r 后 添加 Crr，…，Gp， 使 得 {Da …, 瑟 sa 
是 下: WW, 写 “的 正 交 规范 化 特征 向 量 集 ， 对 5，…, b, 亦 漆 加 
6B.+1,…，Ba, 使 有 上 述 类 似 性 质 ， 记 

A=(aia), B=(b, …, bo), (7.87) 
注意 到 上 述 取 法 有 
Cov(A’)=A'SrrA=T,, 
Cov(B'¥)- B'SyyB-I,. 
由 于 这 xy0j 一 pA 这 xxQi 一 0, 又 得 

Cov1 4 到, B' 了 ) 一 4， 除 主 对 角 元 pi,… or 外 ， 其 余 缘 为 
J， 从 而 有 
. 362 。 
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因此 , 寻求 典型 变量 实际 上 就 是 光 沁 空 量 作 线性 变换 , 使 变换 后 的 
变量 组 具有 如 (7.88) 的 简单 协 方差 结构 故 在 研究 互 依 性 时 , 我 
们 至 少 可 以 殷 痉 那些 使 相应 的 新 变量 组 协 方 差 为 零 的 部 分 ， 从 而 
也 起 了 使 互 依 性 突出 表现 于 若干 组 典型 变量 的 作用 ， 这 也 就 降低 
了 维 数 . 

”在 实际 应 用 典型 相关 时 , 我 们 可 将 相对 很 小 的 Pr 所 对 应 的 典 
型 变量 抛弃 ,而 上 只 考虑 ps 较 大 的 若干 组 典型 变量 , 设 为 前 不 组 ， 记 
4:, 了 Bi 分 别 是 4 吾 的 前 大 列 ， 我 们 可 以 用 4 下 和 召开 的 相 
关 来 近似 地 反映 是 和 王 的 相关 . 

典型 变量 的 另 一 统计 解释 是 ， 若 要 用 六 的 线性 函数 来 也 测 
(7. 87) 则 僵 得 均 方 误差 最 小 的 线性 预测 是 
alX— a BX—poGEBY roo. (7.89) 
事实 上 ， 设 06+C' 了 是 欲求 的 预测 ， 由 (6.18) 得 qf 生 -q! 如 了 
Dry EBT A 忆 xy 庆 直到 由 于 Dyxd=pi2Zyrb,, 得 (7 .89). 
典型 变量 的 一 个 有 意思 的 应 用 是 用 来 给 出 及、 译 的 公共 因子 
台 、 即 存在 名 满足 
人 
了 一 (CQ 十 Sa. 
和 且 有 Cov(2, 81) =0, Cov(G 83)=0, Cov(e1, sa) 一 0. 
事实 上 , (7.90) 中 的 怠 可 取 典 型 变量 4 下 ,4 是 (7.87) 中 妇 4 的 前 
rT 列 ， B, 是 Bb 的 前 人 列 . 注意 到 全 xx 一 了 BEyyB=1,, 有 
DrrAA’=I,, BrrBB’-I1.. . 
故 若 记 4 一 Cov(A1 旦 ,B41 了 ), 就 有 
pe DD.4 
一 立 xvr 1 下 十 袜 xzxa42 且 ; 
Y=- 5yBBIY Bry Bs BY 
= DyBBIAA RESyrBB(Y— AA TX) 
填写 rr 了 


(7.90) 
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记 Z=—A'¥, C= Bzrxrd, Cs— Bry BB'A, 8 一 xxA。45 轩 ， 
2 =— DyyrBB(YT— AA'X) 十 之 yyBaB; 了 ,就 有 兰 , 了 如 (7.90)， 
并 且 容 易 验算 : 
Cov(44 下 ,二 xzr44 下 ) 一 4 二 4.42 瑟 xx 一 0， 
OQovCAIE, es)— AiDrrBB By — ATrrA ABiDyy +0 
一 -PDTrr 一 1 之 rr 一 0， 
Qov(e1, 82)=OCQov(ZrrAsASE, YF-—ByyBB' A )=0. 

故 得 如 是 芷 ,了 的 公共 因子 . 

顺便 指出 ,在 主 成 分 分 析 和 因子 分 析 中 用 过 的 旋转 因子 法 ,在 
典型 相关 分 析 中 已 不 适用 .原因 是 这 里 对 下 ,了 的 变换 要 求 联合 
协 方差 阵 有 结构 (7.88)， 但 任何 旋转 都 将 使 协 方 差 阵 失去 那 种 简 
单 结构 . 

从 样本 观察 人 出 发 的 因子 分 析 和 典型 相关 分 析 ， 可 仿照 一 ) 
中 所 述 的 精神 进行 ,不 在 此 一 一 讨论 . 


习题 


1. 考虑 下 列 样本 (2 一 8 
谷物 重量 ( 久 1) 
稻草 重量 (ba ) 
施 肥 最 


设 mo 一 zo 是 在 第 个 区 组 的 施肥 量 ,4 一 …， 8。 估 计 忆 =( 六 ) 在 


0.01 显著 性 水 平 上 检验 Bs 0. 

2. 证 明 §7.1( 一 ) 中 性 质 5.1°. 

3. 证 明定 理 7.1. 

4. 设 x~NrnpCM, 工 双 , 4, B 是 % 阶 对 称 阵 , 且 4 再 =0， 证 明 . wx'Ax 
与 By 独立 . 

5， 试 证 : 当 xX~NnoCM, 工 2), 3 的 分 布 只 通过 M'M 依 赖 M. 

6， 将 Cochran 定理 推广 到 xx 一 NM 区) 情形 . 

?7， 设 wl，… za 是 取 上 月 正 态 总 体 Nplp, 也 ) 的 i.i.d 样本， 其 中 了 >>0， 
Pp 一 2k， 记 二 C409) ，Kiy、ke) 都 是 无 维 的 。 试 给 出 对 假设 Ho py= 
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Lo) 的 检验 ， 
. a 
8. 设 p 维 正 态 向 量 Y 会 (Yr; Yo 其 中 Yo 为 2 维 ， 之 2 一 六 . 记 


E11 ee Dik 
CovrY=| : : 
Ei "ee Dry 


试 构造 检验 了 (4,，…，Yw) 的 独立 性 (之 ,wy 一 0， i 于 办 的 检验 统计 量 ， 
9， 设 两 个 独立 总 体 分 别 有 分 布 NoCmi， 了 2) 和 NopCh2，2), 设 零 假设 为 
Hos Hi 一 上 一 Ao( 已 知 ) 
10. 股民 YY 分 别 是 wp 维和 g 维 正 态 随机 向 量 , 记 
X ) -( Zi 21 
Y Dat 2 
问 ， 为 何 检验 及 ，Y 的 典型 相关 系数 为 零 ? 
” 11. 设 Y 了 =XB+e 是 多 元 线性 模型 . 
(Qi) 给 出 参数 函数 这 4 如 线性 可 估 的 充 要 条 件 . 


Cov( ) Eu, Doo>0 


mn. Bi\ 、 、 
(iD) 当 B 一 Was(0, 了 5), X= (Xi : Xo), B—( Bp ) 设 零 假设 Ho, HBI 


=0, 
试 给 出 检验 统计 量 ， 
HA 
12. (i) | 上 Byy 一 0，Cov(yy， 抽 ) 一 60n2,，U 是 9 阶 正 
交 隆 , U = (ui ;其 中 uo 一 二 1, 令 Z=UY 


证 明 : 3 的 行 互 不 相关 今 如 一 … 一 儿 o. 

(ii) 设 站 如 (a 一 4，…, %) 是 取 自 Nop 和 9 ， 瑟 ) (9 二 1 9) 的 独立 随机 
样本 , 使 用 Ci) 中 结果 构造 假设 . 

及 如 ==… 二 

的 检验 . 

13. 欲求 模型 (7.50) 中 B 的 极 小 方差 线性 无 偏 估计 MVLUE,， 可 由 相 
应 的 模型 (7 .52) 中 ， 对 一 元 线性 模型 参数 向 量 B, 求 LS 合计 而 得 到 ， 为 什 
人 么 ?( 看 第 六 章 习 题 15). 

14. 试 证 两 个 厨 协 方差 阵 的 总 体 的 马 氏 距离 

OT 富  RI 一 A3) 
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是 在 非 退 化 线性 变化 下 不 变 的 . 
15， 设 久 = (Xi “ey Xo), Y=(Y,, 机 Y,), 是 两 个 随机 向 量 , 其 联合 


分 布 协 方差 阵 为 
or(X)-( 宫 守 ) aa 


_[Cov(Y,bR)E J, 
加 2G9 Db'X) 0) 


(让 求 bée B? 使 得 


达 极 小 . 
(让 ) 求 Be BR? 使 得 
_ [Cov(X,, b'X) 2 
到 per- 
达 极 小 , 其 中 到 i 是 给 定 的 数 . 
16. 设 y=2+6, EZ=E8=0, Cov(Z2)=G, Cove=oa’I,, Cov(Z, 8) 
一 0， 
(1) 求 Ce R? 使 D(C'Y)=1, 且 极 小 化 D(C'3). 
(2) 设 DOD)=14 i=1，……，p。 求 CE Rr? 使 D(C'Y)==1 且 极 大 化 
> (ys, C'Y). 
《3) 上 述 结果 与 主 成 分 有 何 联系 ? 
17 .为 寻求 正 交 变换 二 使 47.82) 中 的 8 达 极 大 值 , 可 令 
_ Yeosp 一 5mg 
r=-( din gp cosgp ). 


试 求 出 ? 为 极 大 值 点 时 应 满足 的 关系 式 。 
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附 表 工 


正 态 分 布 函 数 


本 琢 列 出 了 服从 正 态 分 布 王 (0, 的 随机 芯 量 马 的 分 布 函数 


1 zw 扫 
Dw) -| 4 


的 值 . 

2 Dy) 人 Dm) % Tr) 
0.00 0.500000 1.05 0.853141 2.10 0.982136 
0.05 0.519989 1.10 0.864334 2.15 0.984222 
0.10 0,539828 1.15 0.874928 2.20 0.986097 
0.15 0.559618 1.20 0.884930 2.95 0.987776 
0.30 0.579260 1.25 0.894350 2.30 0.989276 
0.25 0.589706 1.30 D.908200 2 .35 0.990613 
0.30 0.617911 1.85 0.911492 2.40 0.991802 
0.35 0.636831 1.40 0.919243 2 .45 0.992857 
0.40 0.655422 1.45 0.926471 2.50 0.993790 
0.45 0.673645 1.50 0.983193 2.55 0.994614 
0.50 0.691463 1.55 0.939429 2.60 0.9953839 
0.55 0.708840 1.60 0.945301 2.65 0.995975 
0.60 0.725747 1.65 0.950538 2.70 0.996533 
0.65 0.742154 1.70 0.955434 2.75 0.997020 
0.70 0.758036 1.75 0.959941 2.80 0.997445 
0.75 0.773373 T.80 0.964070 2.85 0.997814 
0.80 0.788145 1.85 0.967843 2.90 0.998134 
0.85 0.302338 1.90 03971288 2.95 0.998411 
0.90 0,315940 1.95 0.974412 3.00 0.998630 
0.95 0.329944 2.00 0.977250 
1.00 0.841345 2.05 0.979818 
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605 85 
999 "TS 
060 08 
94P' 8T 
ET8 9T 


980 9T 
L422T 
TPE TT 
0T5 6 
SG869 9 


0°0 


T9T TS 
629 6T 
89T 3T 


339 9T 


880 eT 


888 8T 
899 TT 
288 6 
58 2 
ET S 


50 0 


208 8T 
6T6°9T 
L409° ST 
L90 下 
569 SF 


020 TIT 
88TF 6 
3T8 
T66 "9 
TF8 8 


S0"0 


286 oT 
下 89 °FT 


598 6T 
2T0 8T 
SF9° OL 


985 6 
6.2 2 
T95 9 
809 


902 5 


0F 0 


CT ET 
CFO oF 


080 IT 


608 6 
8S9 8 


685 4 
686 9 
SF9 十 
6T5 8 
2F9°T 


05 0 


T84°" IT B58°6 J95°L 6.T 9 0F6°8 690;8 399 5 OF 
999"0fT | 全 8 8 | E68'9 | 088'9 oe28'8| gee°gl 880°2| 6 
559 6 | 计 6 | L200 | p60'5 £8L°Z| zg0°8| 9F9°T 8 
€86°8 | 956°9 | T19'5 | Ze8'8 29T"8| F991 685'I & 
T8ES | gpe'9 | 8g8 8 | 0208 Se9°T| ett gL8'0 9 
P90°9 TS8 王 000 中 8 BC 0T98 工 FT T 5G2 0 FeG9 站 号 
8L8 和 | 198 8 | 96Tg | G89°T| 90°T| TTL'O0| 625°0! J62'0l 5 
S99°8 | 998g | ep°T | soo°T| F806°0| go8°0| gr'ol gfr'ol & 
805°8 | 988°T | 8tL°0 | gp5°0 | tre"o| eof'0| poo0'ol Tos0'0l 5 
FLOT | S95°0 | SFT"0 | 500°0 | 89T00 |86800"0j8g9Q00'0|29T000'0 | 工 
08°0 | 090 | 02°0 1 08"0 | 06'0 | 96:0 | 86'0 |66'0=»| 芭 
(2) EX 0 
各 
名 
p= ((0) EX <)g | 
诗人 2)2X 汤 于 攻 岂 于 小 霸 毕 如 -oxX 庆 全 蕴 用 目 芍 半 闻 
坐 必 -o% 8 必 华 期 
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《 举 小) 


P68'08 | 896' 十 
839°65 | 869° 全 
815"85 | 6TP' 95 
896 95 | 0 评 
59 oF | 998" 55 
FT8 5 | 998° TIF 
086 ”55 | 022°0F5 
889° TF | 896°88 
685"05 | 69928 
286°88 | E58°98 
998°28 | C29'98 
T6T'98 | 289°8e 
.908 "8 | 058 "88 
.60 88 | 666°08 
.000'88 | 829'62 
‘829°08 | 695 85 
TFT' 68 | £28°92 
889 /2 | 45°98 
L1298 | 590 75 
S64 HE | 8T9755 
T0'0 | £20°0 


£44°9P 
/39 人 
188" 证 
8TT"0F 
088°8¢ 
599'28 
STF 98 
5 人 "98 
f86 "88 
T29'g8 


0T 天 "8 
PPI" O08 
698 “82 
289 25 
968 95 


966 5 
989 "85 
598 85 
950 TS 
S49" 6T 


985 OF 
280 68 
9T6 28 
TFL' 98 
£99° 58 


B86 °F 
96T 88 
L400° 88 
28T8"08 
ST9° 68 


oTP 88 
F028’ L428 
686 "95 
699 °F6 
SF9 85 


208 55 
7F90 TB 
5T3 6T 
0TF9 8 
3925 LT 


0T"0 


0c8°95 
GET 9 
L0 8 
5TI6 88 
S64° TE 


3.9"08 
899 65 
62FP" 82 
T08 22 
TLT'98 
880 55 
006 £5 
092 55 
ST9 18 
G9P" 058 


ITE' 6 
TST'8T 
c86 "9T 
2T8° oT 
TE9°5T 


05 "0 


059 698 
下 9 和 38 
T68 TE 
6T8 08 
9F8° 65 


LT 95 
960 48 
8T0 95 
686 于 C 
898 82 


92.58 
689-T5 
T09°0% 
TT9' 6T 
ST "BT 


588 LT 
555 9T 
6TT SF 
TT0O "地 [ 
668 28T 


08 "0 


805 95 
223 证 


988 65 
988 85 


988 212 | 妹 9 85 
988 98 | 6TL"22 
9868 95 | 264°T8 
28858 | 198 0g 
Le8 88 | 全 6 6T 
2168 85 | 120° 6T 
L828° Te | TOT8T 
Le8°0% | Z8T" 2T 
L226T | 995 9T 
888-8T | zo¢°oT 
8¢¢° LT | 0FF "FT 
888 9T | TS°2T 
88¢° oT | 529°2T 
688 °FT | TELTT 
688'8T | Te8" OT 
O058°2T | 926°6 
OF8°IT | 520°6 


TP8°OT | 8SFT 8 


F986° 86 
9.TF ”55 
889 [8 
50 05 
058 "6T 


OF6 8ST 
590 8T 
28T 外 
FT OT 
9 9T 
849 FT 
9T2 6T 
/98 8 
500 SF 
ZST° TT 


08° OT 
L9P°6 
89°8 
L408"2 
686 9 


669 05 
89. 6T 
68S6 8T 


#TT BT 


868 AT 


£2/ 9 
699 ST 


SS FT 


TEG "PTI 
0F5 8T. 


SFP" 2T 
T99 "TT 
998 "0T 
3980 "0F 
35T8 6 


.3 "8 
062 
5Y0 4 
508 9 
829 9 


06°0 


265°8T | 908°9T 
802°2T | F299T 
826°9T | Lp8°5T 
TST'9T | seT °F 
628°ST | 60F'8T 
TT9°PT | 169'5T 
858'86T | 266°TI 
T60°8T | 86g'TT 
8£8"2T | 009° OT 
T69'TT | ST6°6 
TS8°0T | 482°6 
LTT"OT | 299°8 
068°6 | 906'2 
2L9'8 | gge°L 
390°4 | 5T99 
T9g' | 9869 
TL9°9 | 8989 
268'9 | 994'5 
922°9 | 82T'5 
SLS'$ | 609°8 
96°0 


£96 °FT 
062°FT 
999"8T 
628 5T 
26T "35T 


Peg9" TT 
998 OT 
96T"* OT 
S59°6 
1268 8 


095 8 
£89°2 
8T0° 5 
80F°9 
8T8°9 
622°9 
099' 
LO0T'F 
TL9°8 
8G0 8 


66 0 一 % 


名 


* 369 ， 


8.53 


+: 310 . 


本 表 对 -分布 , 给 出 了 关于 
2a 一 0.05 的 上 侧 分 位 数 Fn,n (9) (上 
面 的 数字 ) 和 关 丁 wa 一 0.01 的 上 侧 
分 位 数 了 Fm,n《%) (下面 的 数字 ) 。 

PlFnn> Tnn(o)) 一 C 


附 表 3 


分 母 的 自由 诬 分 于 的 
和 % 1 2 3 E 5 6 了 8 9 10 | 11i 
1 161! 2300| 216|! 335| 230| 234! 237| 239| 241| 242| 243 

4052| 4999| 5403j 5625| 5764| 5859| 5938| 5981| 6022| 6056! 6082 

2 18.51|19 .00119 .16|19 .25|19 .30|19 .33j19 .36;19 .37|9 .38|j19 .39|19 .40 
98 ,49|99.01!99 .17199 .25I99 .30|99 .33|99 .34|99 .36|99 .38|99 .40|99 .41 

3 10,13| 9.55| 9.38| 9.12| 9.01 8.94| 8.88| 8.84| 8.81| 8.78| 8.76 
34,12|30.81|29 .46|28 .71|28 .24|27 .9112"7 .67|27 .49|27 .34|27 .33|27 .13 

4 7,71| 6.94| 6.591 6.89| 6.26| 6.16| 6.09| 6.04| 6.00| 5.96| 5.93 
21.20|18.00|16 .69|15 .9815 .53115 .21|14.98|14.80l14.66l14.54|14.45 

5 6.61| 5.79| 5.41| 5.19| 5.05| 4.95| 4.88| 4.82| 4.78| 4.74! 4.70 
16.26|13.27|12.06|11 .3910.97|10.67|10,.45|10.27|10.135|10.05|! 9.96 

6 5.99| 5.14| 4.76| 4.58 生 .39!1 4.28| 4.21! 4.15| 4.10| 4.06| 4.03 
13.74|10.92| 9.78| 9.15| 8.75| 8.47| 8,26| 8.10| 了 .98| 了 .87| 7.79 

了 5.59| 4.74| 4.35| 4.12| 3.97| 3.87| 3.79| 3.73| 3.68| 3.63| 3.60 
12.25| 9.55| 8,45| 7.85| 7.46| 7 了 .19| 7.00| 6.84| 6,71| 6.63| 6.54 

8 5.32] 4.46| 4.07| 3.84| 3.69| 3.58| 3.50| 3.44| 3.39| 3.34| 3.31 
11.26| 8.65| 7.59| ?了 .01| 6.68! 6.37| 6.19| 6.03| 5.91| 5.82| 5.74 

9 5.12| 4.26| 3.86| 3.63| 3.48| 3.37| 3.39| 8.23| 3.18| 3,13| 3.10 
10.56| 8.02| 6.99| 6.43| 6.06| 5.80t 5.63 5.47| 5.35| 5.26| 5.18 

10 4.96| 4.10| 3.71| 3.481 3.38| 3.23| 8.14| 3.07| 3.02| 2.97| 2.94 
10.04| 7.56| 6.55| 5.99| 5.64| 5.39| 5.21| 5.06| 4.95| 4.85| 4.78 

11 4.84| 3.98| 3.59| 3.36| 3.30| 3.09| 3.01| 3.95| 2.90! 2.96| 2.82 
9.65| 7.20| 6.22| 5.67| 5.39| 5.07| 4.38| 4.74| 4.63| 4.54| 4.46 

12 4.75| 3.88 3.49 3.301 3.11| 3.00| 2.93| 2.85| 3.80| 2.76| 2.72 
9.33| 6.93| 5.95| 5.4i| 5.06| 4.82] 4.65| 4.50| 4.39: 4.30| 4.22 

13 4.67| 3.80| 3.4H 3.18| 3.03 2.92| 2.84| 2.77| 2.72| 2.67| 2.63 
9.07| 6.70| 5.74 5.20| 4.86| 4.62| 4.44| 4.30| 4.19| 4.10| 4.02 

14 4.60| 3.74| 3.34 8.11f 2.96| 2.85| 2.77| 2.70| 2.65| 2.60! 2.56 
8.86| 6.51| 5.56| 5.03| 4.69| 4.46| 4.28| 4.14| 4.03| 3.94| 3.86 

15 4.54| 3.68| 3.29| 3.06| 2.90[ 2.79| 2.70| 2.64| 2.59| 2.55| 2.51 
8.68| 6.36| 5.42| 4.89| 4.56| 4.32| 4.14! 4.00| 3.89| 3.80 3.73 

16 4.491 3.63| 8.24| 3.01{ 2.85| 2.74| 2.66| 2.59| 2.54| 2.49| 2.45 
6.23| 5.39| 4.77| 4.44| 4.20; 4.08| 3.89| 3.78! 3.69| 3.61 


. 


1 
> 


到 -分 布 


12 |14116130 1 3 130 1 40 75 | 100 | 200 | 500 oo 


一 一 要 要 


244] 245| 246! B48| 349| 250| 251| 2592; 253! 253| 2354| 254| 254 
6106| 6143 6169 6208| 6334| 6358| 6386| 6802 6323! 6334 | 6352| 6361| 6366 


19.41H9 .4319 .43|19 .44|19 .45|19.46|19 .47|19 .47|19 ,48| 19 .49 | 19 .49 |19 .50119.50 
99 .42199 .43|99 .44;99 .45|99 .46j99.47|99 .48|99 .48|99 ,49| 99 .49 1 99 .49 |99 .50199.50 


8.74| 8.71| 8.69 8.66| 8.64 8.63| 8.60| 8.58 8.57| 8.56| 8.54| 8.54| 8.53 
27 .05|26. 92|26 .83|26 .69126 .60|26.50126.4126. 30|26 .27| 26.23 126.18 |26.14 | 36.13 


5.91| 5.87| 5.84! 5.80| 5.77| 5.74| 5.7 5.,70| 5.68| 5.66| 5.65| 5.64| 5.68 
14.37|14.2414.15114.03|18.9313.83|13.74|18.6913.61| 13.57113.52|18.481183.456 


4.68| 4.64 4.60| 4.56; 4.53| 4.50| 4.46| 4.44| 4.43| 4.40| 4.38| 4.37| 4.36 
9.89| 9.77| 9.68| 9.55| 9.47| 9.38| 9.29| 9.24 9.17| 9.13| 9.07| 9.04| 9.02 
4.00| 3.96| 3.93 8.87| 3.84| 3.81 3.77| 3.75| 3.73 3.71| 3.69| 3.68| 3.67 
7.73 引 了 .60 7 .52 7.39| 了.31| 7.323| 7.14| 7.09 7.09 6.99| 6.94| 6.901 6.88 
3.57| 3.53| 3.49| 3.44| 3.41 3.38| 3.34| 3.33| 3.29| 3.28| 3.25| 3.24| 3.23 
6.47| 6.35| 6.27| 6.15| 6.07: 5.98| 5.90| 5.85| 5.78| 5.75| 5.70| 5.67| 5.65 
3.38| 3.33 3.20| 3.15| 3.13| 3.08| 3.05| 3.03| 3.00| 2.98| 2.96| 2.94| 2.93 
5.671 5.56| 5.48| 5.36| 5.28| 5.20| 5.3 5.06| 5.00 4.96| 4.91|-4.88! 4.86 
3.07| 3.03 3.98| 2.93| 2.90| 3.86| 3.8 引 2.80| 3.77| 2.76| 83.731 2.729| 2.71 
5.11n:5.00 4.92| 4.80| 4.73| 4.64| 4.56| 4.51 4.45| 4.41; 4.36| 4.33| 4.3i 
3.91| 2.86| 2.82| 2.77| 2.74| 2.70| 2.67| 2.64 23.61| 2.59| 2.56| 2.55| 2.54 
4.71| 4.60 4.52| 4.411 4.33| 4.25| 4.17| 4.13 4.05| 4.01| 3.96| 3.93| 3.91 
2.79| 2.74 2.70| 2.65| 3.61|! 3.57| 2.53| 2.50 2.47| 2.45| 2.42| 2.41| 2.40 
4.40| 4.29| 4.21| 4.10| 4.02| 3.94| 3.86| 3.80 3.74 3.70| 3.66| 3.62| 83.68 
2.69| 2.64 2.60| 2.54| 2.50| 2.46| 2.42| 2.40| 2.36| 2.35| 2.82| 2.31| 2.30 
4.16| 4.05! 3.98| 3.86| 3.78| 3.70!| 3.61| 8.56| 3.49| 3.46| 3.41| 8.38| 3.36 
3.60| 2.55| 2.51! 2.46! 2.42! 2.38| 2.34; 2.82| 2.28| 2.26| 3.24| 2.29| 2.21 
3.96| 3.85| 3.78| 3.67| 3.59| 3.51! 3.42| 3.37| 3.30| 3.27| 383.21| 3.18| 3.16 
2.53| 2.48| 2.44| 2.39| 2.35| 2.81| 2.37| 2.24| 3.21| 3.191 2.16! 2.14| 2.13 
3.80| 3.70| 3.63| 3.51| 3.43| 3.34| 3.26| 3.21| 383.14| 8.11| 3.06| 3.02| 3.00 
2.48| 2.43| 2.39| 2.33| 2.29| 39.35| 2.21| 2.18| 2.15| 2.12| 2.10| 2.08| 2.07 
3.671 3.56 3.48| 3.36| 3.29| 3.20| 3.13 3.07 3.00 2.97| 2.29| 2.89] 2.87 
2.43| 2.37| 2.33| 2.28| 2.24| 2.20| 2.16| 2.13| 2.09 28.07| 2.04| 2.062| 2.01 
3.55| 3.45| 3,.37j 3.35| 3.18| 3.10| 3.01] 2.96| 2.89| 2.86| 2.80| 2.77 


的 全 
> Se Hm 的 的 的 器 Im oD 
Am Am Am Om Nm Nm 人 的 人 的 
I I 
Am Am Hm Hm Am Am Am Am 
CE 
的 时 全 名 下 


5 


912.1412.0912.0 
2|12.9112.8212.75 


ap 多 的 林寺 
局 四 内 各 本 性 的 名 


Hm dm Hm qm Nm 


- 十 人 的 轴 的 的 
加 的 的 了 HG 村 的 Am qm oIm Am dm qm NH Ho 
包 名 回电 讼 区 六 只 村 
QHD Am Hm dW oq 


号 殉国 性 村 0 的 过 辣 
HN RN NAN A 
mm Nm dm Am Hm 

bt— 0 过 I | 
8 GF 39 HH SH Hg 
Am Nm Am Am dn Nm Hm 
je 与 UL t= 性 3 DO 


的 的 多 的 的 多 的 mm 的 多 8 可 


个 这 0 
Am 的 mm Am Am 
tb 
| 
让 Ea bl . De Dd 
的 的 的 Am 和 的 


dd I I 全 拓 
[ a <H ~ [nr 这 这 
ec 吓 多 本 人 十 加 十 


的 Am am qam Qn qr 
OD 二 如 中 全 中 ed 
5 一 3 ED HS RH Bg 
A 全 十 的 十 人 中 的 中 林寺 林寺 
CN NY NY Am Hm Am Am 
1 SH SK OF go mT TE 
Be 
mm 

oH DH HM a Co 
Id 中 OD io 十 的 it~ 
WO MO HD mH WE 8 


古代 十 的 十 例证 伪证 全 大 证 
SY Nm NH Av a ai od aq ed | 
ft- FE io 的 的 汪 二 二 如 训 
六 全 名 六 导 六 办 和 SB SS RR RR NR 
DR OP PO HP Po WR PP HP PP Me Hm Ho HH Hn Hn 
十 


i 人 打 这 他 器 
中 加 对 如 


于 


HO HO HO Fw 


皇 
JE 
RE 
时 
尔 
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《 续 表 ) 


mn od oq on BE od on Gq on lm 四 的 odo RE] cde oe QQ ood cc oa oad A 


人 1 二 kt 的 人 本 的 柯达 Dr DD 人 站 it 人 和 的 的 你 逻 tm 的 二 
8 有 
Lm] Ti Te TI He bm | TH TI Te Tie TA I 四 如 四 6 Lm Rr | 四 | Tri Ti ri Lm | 
守信 六 史 人 让 有 RR 和 NG CM WY CS OD HH A RH BO HO 
2 mo DD Cn 的 1 0 wn pe Lo ti -一 | : | | 全 二 i 个 : In So: i 的 
i TH 门生 HA A dA 门生 HA HOR HO HO HO HN HO M9 HoH HH HH Hd 
于 ~ < 下 = 的 人 be 的 人 0 
作 ch 人 人 0 S| tw [| [| ~ DD 
* . [a ba [a *. 本 里 本 本 全 [a [a 本 和 [Di LL, 让 二 时 时 a ba Bn . 和 
a HQ HO md HN HN HH A HQ AQ HO HN NN 的 加 HO DH HH 口 癌 
QAD wm TO Om RN 所 局 六 人 攻 这 二 问 的 有 下 交 人 四 人 有 吓 喇 辐 DD 
名 人 的 BH EE dS Se 5 
Ti 有 的 和 人 的 可 吕 的 可 有 人 条约 吉 的 下 区 门人 有 内 可 的 的 的 的 各 9 要 的 可 
HD 已 DD [rN 四 [en | 的 的 I eer 人 心 的 t~ 的 过 2 
论 SF ot So Sn Wm WH WH Em EM A A A mi mT on So 00 oOo 
Wo QQ HQ dO HA NHN NN TN TN TON TN TN TN 站 本 人 可 人 的 FN TOU HN 

oo tO =H eo 全 已 ‘DO en tm 00 Lr | eo 的 网 和 于 joes el [em 6 OD tk— + 中 中 下 1 Sy 操 t— 0 = 
中 0 Ot [| oo 0 证 oO mm Oe ko [| it~ 的 tc t~ 一 tO | ee] 
dN QQ AQN ON 可 OO 可 的 可 站 的 HN NH dN TOU QH dN TO MN To HA 
站 的 ~ 2 Le [et] {tO om en oo bm | [= 村 tt~— IO 1 Tj ch 的 | 1 [um [ep tO ID Hoo tt 于 中 
号 br DO 人 In 00 二 中 Hm Om Om 的 t- 0 ~ 的 [S| [| 
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的 时 全 0 SO CY D0 MH Nm 
当 qm NT 了 汪 是 RO RY Rm mn 
Hm NWO Am AM AN 交友 AY AN AN AYN AN NY A TN TN TN MH MQ 
re 局: 上 - OO 3 0 tt OI. Tt eo er3 TT em 省 0 09 tO i 上 一 < [em 全 Ln " 必 [= ‘OO 
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l 况 i 门人 Om IE WN CO Hm Om ND MM AD OR GY OO Mo mo Nm 
9 mn mm A | A OO To To Ts TD Ho TH OW% Om St OE DO 
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了 Hm 的 | 必 tv 个 中 
Ot SE 己 总 是 全 车 总 岛 驴 人 多 典当 过 革 记 不 全 区 委 区 号 着 生 的 的 WN NN 开关 
多 的 AN AWN AY dN HH dA AN OH TN HO TAN HO HO THO YN 可 NN 可 9A 
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二 表 】 


be 


《 续 


0 的 的 直人 站 妆 受 
8 四 加 和 还 名 囊 史 人 nN HA HH Sr So 
和 日 | [| ns 四 和 . Pe 让 站 四 日 里 
| 
en ht 00 I OO RR ep © rE 
号 短 丈 车 由 的 的 交 总 二 中 rd 全 
. a 四 和 四 上 时 的 本 中 中 . . 时 . 的 中 站 r . 站 站 . 和 委 全 里 
9 A Ho Ha HM rH Mr Hi Hm 


这 的 Ha AYU co om MP Om o0 QH 号 的 全 四 的 记过 
SS 转交 国人 的 的 从 册 过 这 种 于 革 呈 瘦 吕 忌 蕊 可 过 人 WD 的 多 种 的 W 的 多 中 的 站 的 
中 站 四 时 . 时 二 . » 和 - 本 9 二 卜 由 中 a 3 本 血 二 
oN To He dM HM HH Mr MH Hr HH 天 呈 
[ec 和 <H rd om 码 OO m2 
全 大 商 关 胃 间 这 的 人 返 的 遂 生 区 民 大 久生 着 是 所 QU 的 
是 + 四 中 四 村 站 站 四 * 和 血 中 二 和 . a 中 - . . 申 由 由 EP 下 中 本 四 . 
中 下 吃 | TT Pm rim fe Pt ™ri 于 Fr TA Tt pd 了 下 | 1 一 | | tm Tr 
EE bit 
A OH 的 te 0 的 Cm 评 四 人 十 二 I OO or 
这 BG Bm 总 提 区 有 这 站 六 和 六 的 过 区 总 革 员 0 
A rr dm Mr HH TH 
‘IO Hc HO oq 匠心 叶 | 
A A A A Ho FA HM HH MH Hm Mm Hr Mr ri 
Ei ee eer ee 
[ey 连 a0 0 总 心 Li yy “1 | OD Tt [= t= OO Oo 中 中 mn 7] 1 [CS [ip 中 | Lm 与 3 
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于 0 OT 
NA RM RM rH tH BA CS OS vo 记 时 二 村 二 
四 a " 于 +. * . . 1] 和 
bm | Fi 的 和 A Pi -+ Lm {I LA | TF ri ri Le By | Le | 人 Tim Tr rr ir 
A TR TN TT TT 
的 + I 
对 t- 0 t= © t= A ko t™ 加 b= 庆 bt~ -1 mi OO tO CO SO [= I 与 : is 00 i 0 oo 13 ~ 
od NH HH A MA A HO A FN TA HON rd Hr TAH mH HT Hm Mm 
的 吉 A ON Ww 
@ 的 的 史 区 的 区 村 人 RA KF RA Fr FH EH 0 Oo wv 信 呈 攻 全 达 下 疙 本 
本 里 只 里 - 本 要 和 9 本 本 二 
的 9 Hm HM HH 思 一 
OG GO 0 ft 过 Dm HD Mo OR mo HH Im Qn Hq Ba tk 全 
| = tw oo 的 而 铝 拉 oo 0 a0 eo o0 em oO 时 t= 9 t= OF 上 一 天 2 = 一 OD 台电 种 加 鞍 鲍 
二 各 本 二 [a 让 时 和 本 时 a 
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i ee eer ee 


I 的 人 训 他 人 交 蚂 四 站 
人 > 多 On 加 名 i 0 中 如 二 名 的 的 多 名 Lo tA FE Pr oi OO oo 
| ma 的 ric 9 ed og | ri ricd mea -9 mi eq mo mc eq rc ri co 
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附 表 和 大 分 布 


本 表 对 扩 -分 布 给 出 上 侧 分 位 数 (in(@)) 表 ,其 中 #* 是 自由 度 。 


Ph>in(m) 一 G 
fn 
0 inlo) 

& 0.10 0.05 0.025 0.01 
1 3.078 6.314 12.706 31.831 
2 1.886 2.020 4.303 6.965 
3 1.638 2.358 3.182 4.541 
4 1.538 2.132 2.776 3.747 
5 1.476 3.015 2.571 3.365 
6 1.440 1.948 2.447 3.148 
7 1.415 1.895 2.365 2.998 
8 1.397 1.860 2.306 2.896 
9 1.383 1.833 2.262 2.891 

10 1.379 1.812 2.228 2.764 
11 1.363 1.796 2.201 2.718 
13 1.356 414.782 2.179 2.681 
13 1.350 1.771 2.160 2.650 
14 工 ,345 1.761 2.145 2.624 
15 1.841 工 .753 2.181 2.602 
16 1.337 414.746 2.120 2.583 
17 1.338 1.740 2.110 2.567 
18 1.830 1.734 2.101 2.552 
19 1.328 1.729 2.098 2.539 
20 1.325 1.795 2.086 3.528 
21 1,823 1.791 2.080 2.518 
29 1,321 1.717 2.074 2.508 
23 41,319 1.714 2.069 2.500 
24 1.818 1.7i1 2.064 2.492 
25 1.316 1.708 2.060 2.485 
26 1.315 1.706 2.056 2.479 
27 1.314 1.703 2.059 2.473 
28 1.313 1.701 2.048 9.467 
39 1.311 1.699 2.045 2.469 
30 1.310 1.697 2.049 2.457 
40 1.303 1.684 2.021 2.433 
60 1.296 1.671 2.000 2.390 
120 1.289 1.658 1.980 2.358 
co 1.282 1.645 1.960 2.326 


